Сегодня 20 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → гетерогенные вычисления

Учёные нашли способ удвоить скорость вычислений компьютеров без замены железа

На 56-м ежегодном Международном симпозиуме IEEE/ACM по микроархитектуре исследователи из Калифорнийского университета в Риверсайде (UCR) продемонстрировали подход, при котором любые вычислительные компоненты платформы по-настоящему будут работать одновременно. За счёт этого можно в два раза увеличить скорость вычислений и в два раза сократить потребление энергии. Технология может работать на любых процессорах и ускорителях от смартфонов до серверов ЦОД, но требует доработки.

 Источник изображения: ИИ-генерация DALL-E/newatlas.com

Источник изображения: ИИ-генерация DALL-E/newatlas.com

«Вам не нужно [для ускорения вычислений] добавлять новые процессоры, потому что они у вас уже есть», — сказал Хунг-Вей Ценг (Hung-Wei Tseng), адъюнкт-профессор факультета электротехники и вычислительной техники Калифорнийского университета и соавтор исследования. Необходимо лишь грамотно распорядиться имеющимися аппаратными ресурсами, а не выстраивать их все в очередь.

Разработанная исследователями платформа, которую они назвали одновременной и гетерогенной многопоточностью (SHMT), отходит от традиционных моделей программирования. Вместо того чтобы предоставлять за один промежуток времени данные лишь одному из вычислительных компонентов системы — центральному, графическому, тензорному или другому процессору или ускорителю, технология SHMT распараллеливает исполнение кода сразу по всем компонентам одновременно.

 Тестовая платформа. Источник изображения: Hsu and Tseng

Тестовая платформа. Источник изображения: Hsu and Tseng

SHMT использует политику планирования многопоточности с учетом такого параметра, как quality-aware work-stealing (QAWS), которая не требует больших затрат ресурсов, но зато помогает поддерживать контроль качества и баланс рабочей нагрузки. Система исполнения создаёт и делит набор виртуальных операций (vOPS) на одну или несколько высокоуровневых операций (HLOPs) для одновременного использования нескольких аппаратных ресурсов. Затем система исполнения SHMT распределяет эти HLOPS по очередям задач для запуска на целевом оборудовании. Поскольку HLOPS не зависят от оборудования, система исполнения может перенаправлять задачи по мере необходимости на тот или иной компонент вычислительной платформы.

 Сравненние методов распараллеливания обычного, совреемнного гетерогенного и SHMT

Сравнение методов распараллеливания обычного, современного гетерогенного и SHMT

Что особенно ценно, исследователи на примере созданной ими тестовой платформы показали эффективность работы новых программных библиотек. Они создали некий гибрид, который можно считать как смартфоном, так и подобием ПК и даже сервера. На базе объединяющей платы с разъёмом PCIe был создан «компьютер» из комбинации модуля NVIDIA Nano Jetson с четырёхъядерным процессором ARM Cortex-A57 (CPU) и 128 графическими ядрами архитектуры Maxwell (GPU). Через слот M.2 Key E на плате был подключен ускоритель Google Edge (TPU).

 Ускорение вычислений SHMT в зависимости от выбранной политики

Ускорение вычислений SHMT в зависимости от выбранной политики

Основная память представленной системы — это 4 Гбайт LPDDR4 с частотой 1600 МГц и скоростью 25,6 Гбит/с, где хранятся общие данные. Модуль Edge TPU дополнительно содержит 8 Мбайт памяти, а в качестве операционной системы использовался Ubuntu Linux 18.04.

 Сравнение потребления в активном режиме и при простое при обычных вычислениях и с использованием SHMT

Сравнение потребления в активном режиме и при простое при обычных вычислениях и с использованием SHMT

Запуск на импровизированной гетерогенной платформе пакета SHMT с использованием стандартных приложений для тестирования показал, что при наиболее эффективной политике фреймворк QAWS показывает увеличение скорости вычислений в 1,95 раза и значительное сокращение потребления — на 51 % по сравнению с базовым методом распределения вычислений. Если масштабировать этот подход для использования в составе ЦОД, то выигрыш обещает оказаться колоссальным и при этом всё «железо» останется прежним — менять ничего не придётся. Предложенное решение пока не готово к внедрению, но наверняка без труда найдёт заинтересованных в этом лиц.


window-new
Soft
Hard
Тренды 🔥
Microsoft начала тестировать Windows 11 27H2 — под это в Windows Insider создали новый канал 12 мин.
Google заблокировала тысячи разработчиков и удалила миллионы сомнительных приложений в 2025 году 47 мин.
Google сделала Chrome удобнее для работы — браузер получил разделённый экран и заметки в PDF 50 мин.
Спустя девять лет ожиданий гоблинский стелс-экшен Styx: Blades of Greed стартовал в Steam с «в основном положительными» отзывами 3 ч.
Google представила поумневшую ИИ-модель Gemini 3.1 Pro — «для задач, где простого ответа недостаточно» 4 ч.
Интернет наводнили критические спойлеры к Resident Evil Requiem — сюжет, концовка, судьбы героев и не только 4 ч.
Кодзима заинтриговал фанатов тизером нового трейлера — Kojima Productions готовит жуткий хоррор OD и шпионский боевик Physint в духе Metal Gear Solid 4 ч.
Китайская ByteDance разгоняет разработку передового ИИ прямо в США — открыты десятки вакансий 5 ч.
Глава Google DeepMind: автономный ИИ может выйти из-под контроля — нужно глобальное регулирование 5 ч.
Многие функции «Google Карт» стали недоступны неавторизованным пользователям 5 ч.
Intel внедрила ИИ в техподдержку — но он даёт глупые и опасные советы 2 ч.
Квантовая телепортация по городскому интернету: Deutsche Telekom успешно протестировала технологию в Берлине 2 ч.
AMD установила мировой рекорд разгона GPU — Radeon RX 9060 XT довели до 4769 МГц 2 ч.
Отечественная замена МКС задерживается: старт развёртывания Российской орбитальной станции теперь планируется на 2028 года 5 ч.
Аккумуляторы впервые обеспечили около двух суток почти непрерывной «солнечной» энергии в Калифорнии 5 ч.
Титановый корпус, яркий экран и месяц автономности: Amazfit представила смарт-часы T-Rex Ultra 2 для активных пользователей 7 ч.
Глубоко копают: Google заказала ещё 150 МВт геотермальной энергии для своих ЦОД 7 ч.
Humain из Саудовской Аравии инвестировала $3 млрд в стартап xAI Илона Маска 7 ч.
«Прогоревший» криптомайнер: NFN8 не пережила пожар в ЦОД, падение биткоина и переметнувшегося к OpenAI партнёра 8 ч.
Microsoft бросилась исправлять ИИ-неравенство в мире и выделила на это $50 млрд 9 ч.