Сегодня 26 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Телевизоры в ремейке Silent Hill 2 скрывают зашифрованные сообщения — они написаны с помощью азбуки Морзе 6 ч.
«Крупнейшая Call of Duty в истории»: Activision похвасталась успехами Black Ops 6 за первый месяц с релиза 7 ч.
Игры ещё нет, а Трой Бейкер уже есть: звезда The Last of Us и Uncharted 4 подтвердил участие в новой игре Naughty Dog 8 ч.
Второй трейлер «Соника 3 в кино» привёл зрителей в восторг 10 ч.
Telegram снова оштрафован в России за неудаление запрещённого контента — теперь на ₽7 млн 10 ч.
Nvidia представила ИИ-модель Fugatto, которая «понимает и генерирует звук, как это делают люди» 11 ч.
Ирландская газета рассекретила, сколько Larian заработала благодаря Baldur’s Gate 3 в 2023 году 12 ч.
Хакеры нашли способ отключать антивирус Avast с помощью его же драйвера 13 ч.
В России задумались ввести прокатные удостоверения для видеоигр, но это чревато серьёзными последствиями 15 ч.
Всё серьёзно: Александр Невский подтвердил работу над фильмом Serious Nevsky по мотивам Serious Sam 17 ч.
Новая статья: Практикум по ИИ-рисованию, часть двенадцатая: быстрое прототипирование с FLUX.1 [dev] 4 ч.
Neuralink запустила разработку роборуки с подключением к человеческому мозгу 5 ч.
Новая статья: Обзор складного смартфона TECNO PHANTOM V Flip2: экран больше, цена та же 6 ч.
Samsung готовит самый быстрый OLED-монитор в мире — 27 дюймов, 1440p и 500 Гц 8 ч.
Xiaomi собралась выпустить собственный процессор для смартфонов, выяснили тайваньские СМИ 8 ч.
Amazon вложит ещё $4 млрд в Anthropic и снизит её зависимость от Nvidia 9 ч.
Oppo представила смартфоны Reno13 и Reno13 Pro — до 1 Тбайт памяти и Dimensity 8350 по цене от $370 11 ч.
Крупнейший производитель стекла для смартфонов нашёл способ отбиться от антимонопольного расследования в ЕС 11 ч.
Atos вновь готовится продать французскому правительству часть бизнеса 12 ч.
В Lattice Semiconductor обсуждают возможность покупки у Intel всего FPGA-подразделения Altera 13 ч.