Сегодня 19 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Энергопотребление ИИ удалось снизить на 95 % без потерь, но Nvidia новый алгоритм вряд ли одобрит

В условиях растущей популярности искусственного интеллекта высокое энергопотребление ИИ-моделей становится всё более актуальной проблемой. Несмотря на то, что такие техногиганты, как Nvidia, Microsoft и OpenAI, пока не говорят об этой проблеме громко, явно преуменьшая её значение, специалисты из BitEnergy AI разработали технологию, способную значительно снизить энергопотребление без существенных потерь в качестве и скорости работы ИИ.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно исследованию, новый метод может сократить использование энергии вплоть до 95 %. Команда называет своё открытие «Умножением линейной сложности» (Linear-Complexity Multiplication) или сокращённо L-Mul. Как пишет TechSpot, этот вычислительный процесс основан на сложении целых чисел и требует значительно меньше энергии и операций по сравнению с умножением чисел с плавающей запятой, которое широко применяется в задачах, связанных с ИИ.

На сегодняшний день числа с плавающей запятой активно используются в ИИ для обработки очень больших или очень малых чисел. Они напоминают запись в бинарной форме, что позволяет алгоритмам точно выполнять сложные вычисления. Однако такая точность требует крайне больших ресурсов и уже вызывает определённые опасения, так как некоторым ИИ-моделям нужны огромные объёмы электроэнергии. Например, для работы ChatGPT требуется столько электроэнергии, сколько потребляют 18 000 домохозяйств в США — 564 МВт·ч ежедневно. По оценкам аналитиков из Кембриджского центра альтернативных финансов, к 2027 году ИИ-индустрия может потреблять от 85 до 134 ТВт·ч ежегодно.

Алгоритм L-Mul решает эту проблему за счёт замены сложных операций умножения с плавающей запятой на более простые сложения целых чисел. В ходе тестирования ИИ-модели сохранили точность, при этом энергопотребление для операций с тензорами сократилось на 95 %, а для скалярных операций на 80 %.

L-Mul также улучшает и производительность. Оказалось, что алгоритм превосходит текущие стандарты вычислений с 8-битной точностью, обеспечивая более высокую точность с меньшим количеством операций на уровне битов. В ходе тестов, охватывающих различные задачи ИИ, включая обработку естественного языка и машинное зрение, снижение производительности составило всего 0,07 %, что специалисты сочли незначительной потерей на фоне огромной экономии энергии.

При этом модели на основе трансформеров, такие как GPT, могут получить наибольшую выгоду от использования L-Mul, поскольку алгоритм легко интегрируется во все ключевые компоненты этих систем. А тесты на популярных моделях ИИ, таких как Llama и Mistral, показали даже улучшение точности в некоторых задачах.

Плохая новость заключается в том, что L-Mul требует специализированного оборудования и современные ускорители для ИИ не оптимизированы для использования этого метода. Хорошая новость заключается в том, что уже ведутся работы по созданию такого оборудования и программных интерфейсов (API).

Одной из возможных преград может стать сопротивление со стороны крупных производителей чипов вроде Nvidia, которые могут замедлить внедрение новой технологии. Так как, например, Nvidia является лидером в производстве оборудования для искусственного интеллекта и маловероятно, что она так просто уступит позиции более энергоэффективным решениям.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
EA обновила тестовую версию следующей Battlefield до «альфы», а в файлах игры засветились материалы королевской битвы 25 мин.
«Я извлёк урок из истории ВКонтакте»: Дуров заявил, что никогда и ни за что не продаст Telegram 5 ч.
В Elden Ring Nightreign без предупреждения добавили хардкорную версию одного из финальных боссов, и это только начало 6 ч.
Telegram временно запретили в Малайзии за отказ сотрудничать с властями 6 ч.
Входить в Facebook можно будет с помощью ключей доступа 6 ч.
Capcom анонсировала игровую презентацию Capcom Spotlight — покажут Resident Evil Requiem, Pragmata и не только 9 ч.
«Весёлая, простая и красивая»: Midjourney запустила V1 — свою первую ИИ-модель для генерации видео по изображениям 9 ч.
OpenAI перестанет работать с ИИ-стартапом Scale AI из-за его сближения с Meta 9 ч.
Google интегрирует в YouTube Shorts свою новую ИИ-модель генерации видео Veo 3 10 ч.
В переговорах OpenAI и Microsoft сохраняется несколько важных противоречий 11 ч.
ИИ потребляет чудовищные объёмы энергии — экологи бьют тревогу, хотя точные цифры не знает никто 59 мин.
Экзафлопсный суперкомпьютер Fugaku Next получит Arm-процессоры Fujitsu MONAKA-X 60 мин.
Беспилотные такси в городах России появятся не раньше 2030 года 2 ч.
Здесь ЦОД с ИИ, здесь Grok'ом пахнет: экоактивисты подали в суд на xAI за использование газовых турбин для суперкомпьютера Colossus 2 ч.
Космический шедевр — создано самое детальное и самое многоцветное изображение галактики 4 ч.
Разработку российского электромобиля e-Neva заморозили 4 ч.
«Билайн» выходит на орбиту: оператор подключится к спутникам «российского Starlink» 5 ч.
Bloom Energy: к 2030 году более четверти ЦОД в США обзаведутся собственными электростанциями 5 ч.
Учёные MIT научили 3D-принтеры печатать из стекла — и для этого не нужен жар печи 5 ч.
«Лаборатория Касперского» спасла от ликвидации свою компанию в Великобритании 6 ч.