Сегодня 06 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Энергопотребление ИИ удалось снизить на 95 % без потерь, но Nvidia новый алгоритм вряд ли одобрит

В условиях растущей популярности искусственного интеллекта высокое энергопотребление ИИ-моделей становится всё более актуальной проблемой. Несмотря на то, что такие техногиганты, как Nvidia, Microsoft и OpenAI, пока не говорят об этой проблеме громко, явно преуменьшая её значение, специалисты из BitEnergy AI разработали технологию, способную значительно снизить энергопотребление без существенных потерь в качестве и скорости работы ИИ.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно исследованию, новый метод может сократить использование энергии вплоть до 95 %. Команда называет своё открытие «Умножением линейной сложности» (Linear-Complexity Multiplication) или сокращённо L-Mul. Как пишет TechSpot, этот вычислительный процесс основан на сложении целых чисел и требует значительно меньше энергии и операций по сравнению с умножением чисел с плавающей запятой, которое широко применяется в задачах, связанных с ИИ.

На сегодняшний день числа с плавающей запятой активно используются в ИИ для обработки очень больших или очень малых чисел. Они напоминают запись в бинарной форме, что позволяет алгоритмам точно выполнять сложные вычисления. Однако такая точность требует крайне больших ресурсов и уже вызывает определённые опасения, так как некоторым ИИ-моделям нужны огромные объёмы электроэнергии. Например, для работы ChatGPT требуется столько электроэнергии, сколько потребляют 18 000 домохозяйств в США — 564 МВт·ч ежедневно. По оценкам аналитиков из Кембриджского центра альтернативных финансов, к 2027 году ИИ-индустрия может потреблять от 85 до 134 ТВт·ч ежегодно.

Алгоритм L-Mul решает эту проблему за счёт замены сложных операций умножения с плавающей запятой на более простые сложения целых чисел. В ходе тестирования ИИ-модели сохранили точность, при этом энергопотребление для операций с тензорами сократилось на 95 %, а для скалярных операций на 80 %.

L-Mul также улучшает и производительность. Оказалось, что алгоритм превосходит текущие стандарты вычислений с 8-битной точностью, обеспечивая более высокую точность с меньшим количеством операций на уровне битов. В ходе тестов, охватывающих различные задачи ИИ, включая обработку естественного языка и машинное зрение, снижение производительности составило всего 0,07 %, что специалисты сочли незначительной потерей на фоне огромной экономии энергии.

При этом модели на основе трансформеров, такие как GPT, могут получить наибольшую выгоду от использования L-Mul, поскольку алгоритм легко интегрируется во все ключевые компоненты этих систем. А тесты на популярных моделях ИИ, таких как Llama и Mistral, показали даже улучшение точности в некоторых задачах.

Плохая новость заключается в том, что L-Mul требует специализированного оборудования и современные ускорители для ИИ не оптимизированы для использования этого метода. Хорошая новость заключается в том, что уже ведутся работы по созданию такого оборудования и программных интерфейсов (API).

Одной из возможных преград может стать сопротивление со стороны крупных производителей чипов вроде Nvidia, которые могут замедлить внедрение новой технологии. Так как, например, Nvidia является лидером в производстве оборудования для искусственного интеллекта и маловероятно, что она так просто уступит позиции более энергоэффективным решениям.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Будущее TikTok в США всё ещё под вопросом: переговоры с потенциальными покупателями так и не начались 33 мин.
Симулятор официанта The Way of the Tray перенесёт игроков в мир японских духов, вдохновлённый аниме студии Ghibli 2 ч.
AMD выпустила драйвер с поддержкой Radeon RX 9070/RX 9070 XT, FSR 4 и генератором кадров AFMF 2.1 3 ч.
Олды тут? Sony обновила прошивку PlayStation 3, несмотря на то, что устройству почти 20 лет 3 ч.
Split Fiction стала самой высокооценённой игрой Electronic Arts на Metacritic со времён Mass Effect 3 — она вышла 13 лет назад 3 ч.
«Сургуч» для ЭЦП: в ОС «Альт появилось новое приложение для упрощения ЭДО 3 ч.
Поддержка модов, цирюльник и более тысячи улучшений: разработчики Kingdom Come: Deliverance 2 подтвердили дату выхода первого большого обновления 4 ч.
Разработчики DuckDuckGo улучшили ИИ-технологии в поисковике 4 ч.
Christie's провела первый аукцион ИИ-картин — три десятка работ продали за $728 тыс. 4 ч.
Google добавил сервис ИИ-поиска одежды в магазинах по её текстовому описанию 4 ч.
В России в продаже появились «ввезённые официально» GeForce RTX 5090 с ценой 399 тыс. руб. 42 мин.
Brother настаивает, что её принтеры не теряли совместимости со сторонними расходниками и обещает «устранить источник лжи» 2 ч.
Китай запустит программу господдержки разработки и внедрения чипов RISC-V 3 ч.
По итогам февраля Snapdragon 8 Elite вернул лидерство в тесте AnTuTu благодаря OnePlus Ace 5 Pro 4 ч.
Compal и Kalyani Group займутся совместным выпуском серверов в Индии 4 ч.
Nebius построит 300-МВт ИИ ЦОД в Нью-Джерси и разместит оборудование в Исландии 5 ч.
Трамп встретится с главами Intel, Qualcomm, HP и IBM: на кону тарифы, экспорт и судьба «Закона о чипах» 6 ч.
Глава Qualcomm не воспринял модем Apple C1 всерьёз — из-за него «отрыв Android-смартфонов от iPhone только вырос» 7 ч.
Будущий складной iPhone останется без FaceID, но будет стоить более $2000 8 ч.
1,5 Пбайт в 2U и 120 Гбайт/с: PEAK:AIO представила обновлённое All-Flash хранилище AI Data Server 8 ч.