Сегодня 17 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

IBM разработала энергоэффективный аналоговый процессор для ИИ

IBM создала процессор для ИИ на аналоговой основе с низким энергопотреблением. Этот прорыв может решить проблему высокого энергопотребления, характерную для больших языковых моделей, таких как ChatGPT.

 Источник изображения: ColiN00B / Pixabay

Источник изображения: ColiN00B / Pixabay

Большие языковые модели, стоящие за такими технологиями, как ChatGPT, невероятно сложны. Они содержат миллиарды вычислительных узлов и требуют множества соединений между ними. Это приводит к множественным обращениям к памяти и высокому энергопотреблению.

Один из способов решения этой проблемы — комбинирование памяти и блоков обработки данных. IBM и Intel уже разработали чипы, в которых каждому нейрону предоставляется необходимая память для выполнения своих функций. Альтернативой такому подходу является выполнение операций прямо в памяти, что было продемонстрировано с использованием фазово-изменяемой памяти (phase-change memory).

IBM продемонстрировала новый чип на основе фазово-изменяемой памяти, который ближе к функциональному процессору ИИ. В статье, опубликованной в Nature, компания показала, что её аппаратное обеспечение может выполнять распознавание речи с приемлемой точностью и значительно меньшим энергопотреблением.

Фазово-изменяемая память находится в разработке уже довольно долго. Она сочетает в себе долговечность флеш-памяти и производительность, сравнимую с существующей оперативной памятью. Эта память работает на основе нагрева небольшого участка материала и контроля скорости его охлаждения.

Такое поведение оказалось идеальным для нейронных сетей. В нейронных сетях каждый узел получает входной сигнал и, основываясь на своём состоянии, определяет, сколько этого сигнала передать дальше. Благодаря свойствам фазово-изменяемой памяти, эту силу можно представить в виде отдельного бита памяти, работающего в аналоговом режиме.

Когда мы сохраняем информацию, она использует два основных состояния — включено и выключено. Эти состояния созданы таким образом, чтобы минимизировать ошибки при сохранении данных. Однако интересно то, что мы можем настроить эту память так, чтобы она принимала любое промежуточное значение между «включено» и «выключено», создавая аналоговое поведение.

Это похоже на регулировку громкости музыки — от низкой до высокой, где каждый уровень громкости представляет собой плавный градиент потенциальных значений. Таким образом, мы можем использовать эти промежуточные значения для отображения разной «силы» или важности связей в нейронных сетях.

IBM уже демонстрировала эффективность этого подхода. Однако описанный чип гораздо ближе к функциональному процессору. Он содержит всю необходимую начинку для соединения отдельных узлов и работает на масштабе, приближенном к большим языковым моделям.

Основным компонентом нового чипа является так называемая плитка — это массив крестовин (представьте себе квадратную сетку) из отдельных битов фазово-изменяемой памяти размером 512 на 2 048 единиц. Каждый чип содержит 34 таких плитки, что равно примерно 35 млн бит фазово-изменяемой памяти.

Гибкость работы процессора позволяет контролировать силу любого соединения переменным числом битов. Кроме того, возможна коммуникация между чипами, что позволяет разделять большие задачи между несколькими чипами.

Для демонстрации работы исследователи использовали процессор для распознавания речи. В результате он смог выполнить 12,4 трлн операций на каждый ватт потребляемой мощности на пике своей производительности. Это во много раз меньше, чем потребляемая мощность традиционного процессора для выполнения эквивалентных операций.

Однако стоит отметить, что он оптимизирован для работы только с определённым типом нейронных сетей. Также он не очень подходит для обучения ИИ, и процесс обучения нейронной сети должен быть адаптирован под этот процессор. Несмотря на то, что этот процессор не является универсальным для ИИ, он предлагает значительное снижение энергопотребления.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Заплатил бы на 15 % больше»: Baldur’s Gate 3 получила в Steam самую большую скидку с момента релиза 4 ч.
3Logic локализует в России китайскую платформу Gitee и перенесёт 100 тыс. open source проектов 5 ч.
Ghost of Tsushima наконец вышла на ПК, а оверлей PlayStation звёзд с неба не хватает 6 ч.
Microsoft PC Manager начал настоятельно рекомендовать поисковик Bing 7 ч.
В TikTok появились 60-минутные видео, но загружать их могут не все 7 ч.
Manor Lords превзошла «самые смелые» ожидания издателя — игра достигла новой вершины продаж 8 ч.
Датамайнер поделился подробностями следующей игры Valve — это героический PvP-шутер в мире фэнтезийного стимпанка 8 ч.
Ubisoft раскрыла стратегию на ближайшее будущее, но Watch Dogs в нём места не нашлось 9 ч.
Fallout 4 оказалась самой продаваемой игрой в Европе за апрель — спустя почти девять лет после релиза 11 ч.
Meta грозят огромные штрафы: ЕС расследует, как обеспечивается безопасность детей в Facebook и Instagram 13 ч.
Новая статья: Обзор 57-дюймового игрового Mini-LED VA-монитора Samsung Odyssey Neo G95NC: с запасом на будущее 5 ч.
Шестое поколение ускорителей Google TPU v6 готово к обучению ИИ-моделей следующего поколения 5 ч.
TSMC запустит массовое производство по оптимизированному 3-нм техпроцессу N3P уже в этом году 7 ч.
Palit представила белые видеокарты GeForce RTX 4070 White и RTX 4060 Ti White 9 ч.
В Индии испытали напечатанный на 3D-принтере ракетный двигатель 10 ч.
Сверхпрочный смартфон IIIF150 Air2 Ultra получил тонкий корпус, чип Dimensity 7050 и 64-Мп камеру с ночным видением 10 ч.
Чип Apple M4 в iPad Pro протестировали под жидким азотом — на 28 % быстрее M3 Max, но только в одноядерном тесте 10 ч.
Представлен смартфон Meizu 21 Note с чипом Snapdragon 8 Gen 2, Wi-Fi 7 и ценой $360 11 ч.
Fujifilm представила GFX 100S II — среднеформатную беззеркалку с ИИ за $4999 11 ч.
G.Skill представила комплекты памяти Ripjaws M5 RGB со скоростью до 6400 МТ/с и объёмом до 96 Гбайт 11 ч.