Сегодня 16 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 2 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 2 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 3 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 4 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 6 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 6 ч.
Opera Mini получила ИИ-помощника Aria AI 7 ч.
Orion soft уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке РФ 7 ч.
Шведские учёные обучили ИИ переводу с лошадиного 7 ч.
Похищение Дракулы, интерактивные сны и 35 квестов: сооснователь Warhorse рассказал, что вырезали из Kingdom Come: Deliverance 2 8 ч.
Представлен геймерский смартфон Nubia RedMagic 10 Air — со Snapdragon 8 Gen 3 и батареей на 6000 мА·ч за $475 40 мин.
Будущее OLED-мониторов за квантовыми точками — QD-OLED захватят 73 % рынка в этом году 47 мин.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 2 ч.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 2 ч.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 2 ч.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 4 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 4 ч.
atNorth отдаст тепло ЦОД финскому ретейл-гиганту Kesko 4 ч.
Уникальный суперкомпьютер Anton 3 для задач молекулярной динамики введён в эксплуатацию 6 ч.
Pure Storage анонсировала младшую All-Flash СХД FlashArray//RC20 для периферийных развёртываний 7 ч.