Сегодня 07 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Rockstar подтвердила, что второй трейлер GTA VI целиком записан на базовой PS5 и даже содержит геймплей 13 мин.
Цукерберг заявил, что ИИ сможет решить проблему одиночества и заменить психолога 21 мин.
Apple добавит в Safari ИИ-поиск на фоне падения популярности поисковика Google 26 мин.
Electronic Arts пока не видит причин повышать стоимость игр до $80, несмотря на пример Microsoft и Nintendo 2 ч.
Шутер La Quimera от бывших разработчиков Metro без предупреждения ворвался в ранний доступ Steam 4 ч.
Энтузиаст возродил «Скрепыша» из старого Microsoft Office в виде ИИ-ассистента 4 ч.
Sony открыла новую внутреннюю студию для создания игр-сервисов — в teamLFG вошли ветераны разработки Halo, League of Legends, Fortnite и Roblox 5 ч.
Вышла операционная система «Альт Рабочая станция К» 11.0: Wayland по умолчанию и мегавыпуск KDE Plasma 6 6 ч.
Моддеры запустили классическую Doom внутри Zelda 64: Recompiled — неофициального порта The Legend of Zelda: Majora's Mask на ПК 6 ч.
Ядро Linux лишится поддержки процессоров Intel 486 и ранних 586 6 ч.
MSI представила игровой 4K-монитор MAG 272UP QD-OLED X24 с частотой обновления 240 Гц 18 мин.
Intel исправила ещё одну проблему, приводившую к нестабильной работе Raptor Lake 37 мин.
Публичный Wi-Fi стал спасением для москвичей на время перебоев мобильной связи 4 ч.
В Москве предупредили о перебоях в работе сотовой связи и сервисов — Кремль призвал отнестись с пониманием 5 ч.
Советская станция «Космос-482» рухнет на Землю 9–10 мая — она никому не навредит, уверены в «Роскосмосе» 5 ч.
AMD получила рекордную квартальную выручку, но ожидает до $1,5 млрд потерь из-за экспортных ограничений США 6 ч.
Amazon Zoox отозвала ПО для своих роботакси после ДТП в Лас-Вегасе 7 ч.
Крупнейший производитель iPhone начнёт выпускать электромобили Mitsubishi 7 ч.
Продажи Apple Watch падают уже два года подряд — сказывается недостаток новых функций 7 ч.
Roblox развернёт новый ЦОД в Сан-Паулу в 2026 году 8 ч.