Сегодня 25 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple призвала ЕС отменить «Закон о цифровых рынках» — он мешает бизнесу и замедляет развитие 9 мин.
Цукерберг переманил из OpenAI ещё одного крупного исследователя в сфере ИИ 2 ч.
«Чувствую себя настоящим солдатом, просто наблюдая за этим»: трейлер сюжетной кампании Battlefield 6 вызвал восторги у игроков 2 ч.
«Жду больше, чем GTA VI»: амбициозный боевик Saros от создателей Returnal обрадовал игроков геймплейным трейлером с датой выхода 2 ч.
Госдума приняла закон против автоматических списаний за онлайн-подписки 3 ч.
Google попросила Верховный суд США спасти её от решения по делу Epic 3 ч.
Премьера геймплея ролевой игры Zero Parades: For the Dead Spies: диалоги, загадки и наряды главной героини 3 ч.
Роскачество проверило популярные игры на «способы вытягивания денег» у пользователей — результаты неутешительные 3 ч.
«РТК-ЦОД» открыла новую площадку R&D-лаборатории на базе московского дата-центра 5 ч.
«Лучшая игра про Росомаху в истории»: кровавый геймплейный трейлер Marvel’s Wolverine подтвердил релиз в 2026 году 13 ч.
ИИ-гонка увеличила мировые расходы на оборудование для производства чипов на 23 % во II квартале 14 мин.
КТ-сканирование показало скрытую опасность дешёвых литиевых аккумуляторов 23 мин.
Вместо тысяч рабочих мест Intel принесла жителям Огайо разбитые дороги и шум 34 мин.
Sony выпустила геймпад DualSense к юбилею God of War в пепельно-алой расцветке 43 мин.
В России поступили в продажу смартфоны Infinix HOT 60 Pro и HOT 60 Pro+ по цене от 12 990 рублей 52 мин.
Учёные NASA задумались о ядерном ударе по угрожающему Луне астероиду 54 мин.
NETLAB представила источники бесперебойного питания CBR — защита техники по доступной цене 2 ч.
Sony представила беспроводные колонки PlayStation Pulse Elevate для геймеров — они совместимы с PS5, ПК или Mac 2 ч.
Представлен смартфон Honor X9d — огромная батарея на 8300 мА·ч, защита IP69K и цена от $355 2 ч.
Клин клином: российские учёные заглушили шумы квантовых вычислений контролируемым шумом 2 ч.