Сегодня 09 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Госдума РФ не приняла закон о легализации «белых» хакеров 15 мин.
OpenAI удалось заполучить четырёх классных специалистов из Tesla, xAI и Meta 4 ч.
В США появится не только свой TikTok, но и CapCut 11 ч.
Microsoft наконец добавила в Teams цепочки обсуждений — треды 11 ч.
Microsoft устранила 137 уязвимостей, включая 14 критических и одну нулевого дня 11 ч.
Apple Lisa воссоздали в браузере до мельчайших деталей — дорогой компьютер 1983 года стал доступен всем 11 ч.
В Gmail добавят удобный способ отписаться от ненужных рассылок 11 ч.
«Проведите время с пользой, ведь мы все умрём»: экзистенциальная игра о скоротечности жизни Time Flies получила дату выхода и новый трейлер 12 ч.
С новым патчем в The Last of Us Part II Remastered появился хронологический режим — он позволит по-иному взглянуть на сюжет игры 13 ч.
«Не передать словами, что это значит для нас»: создатели философского выживания The Alters похвастались продажами игры 14 ч.
Продажи Tesla упали даже в Китае, где до этого росли три квартала подряд 2 ч.
Поставки ПК во втором квартале выросли на 6,5 % под влиянием угрозы таможенных тарифов в США 3 ч.
В Apple сменился операционный директор, который может в будущем заменить Тима Кука 4 ч.
Новая статья: Обзор видеокарты GIGABYTE AORUS GeForce RTX 5060 Ti ELITE 16G: цена тишины 8 ч.
Новая статья: Обзор беспроводной колонки Tronsmart Bang Max: дачный певец 9 ч.
Первая национальная ракета Канады «Тайга» стартует в августе — через пару лет полетит «Тундра» 11 ч.
Tecno представила серию тонких и доступных смартфонов Spark 40 с ворохом ИИ-функций 12 ч.
Мощнейший Ryzen Threadripper Pro 9995WX показался в магазинах по цене $12 800 13 ч.
SSD и оперативная память подорожают — Трамп анонсировал 25-% пошлину на все товары из Японии и Южной Кореи 14 ч.
Британская полиция выделит £75 млн на оцифровку своих архивов VHS-видеокассет 15 ч.