Новая технология активного шумоподавления с ИИ позволяет выделить определённые звуки и убрать все лишние

18.05.2024 14:50, Владимир Мироненко

Команда исследователей из Вашингтонского университета во главе с доцентом Шьямом Голлакотой (Shyam Gollakota) предложила технологию активного шумоподавления в реальном времени с использованием ИИ, позволяющую удалять посторонний шум, выделяя нужные звуки. Исследователи продемонстрировали 16 мая на конференции, проводившейся Американским акустическим обществом (ASA) и Канадской акустической ассоциацией (CAA), работающий прототип системы.

HUAWEI Pura 80 Ultra глазами фотографа

Первый взгляд на смартфон HUAWEI Pura 80 Ultra

Пять причин полюбить HONOR 400

Обзор смартфона HONOR 400: реаниматор

HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей

Обзор HUAWEI MatePad Pro 12.2’’ (2025): обновление планшета с лучшим экраном

Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку

Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения

Пять причин полюбить ноутбук HONOR MagicBook Pro 14

Источник изображения: Shyam Gollakota

Они использовали нейронную сеть на базе смартфона для идентификации, обучения и фильтрации 20 различных категорий звуков окружающей среды, которые обычно можно слышать ежедневно, например, звук сирен, будильники, плач младенца, автомобильные гудки и пение птиц. Пользователю необходимо выбрать определённую категорию звуков на смартфоне, после чего начинается процесс фильтрации окружающего шума — программное обеспечение идентифицирует нужные звуки в режиме реального времени и убирает посторонние. Как утверждают исследователи, эта технология может быть полезной, когда избежать шума окружающей среды невозможно.

«Представьте, что вы находитесь в парке и наслаждаетесь щебетанием птиц, но вдруг её перекрывает громкая болтовня находящейся поблизости группы людей, которая не прекращается, — говорит Голлакота. — А теперь представьте, что если бы ваши наушники могли дать вам возможность сосредоточиться на звуках птиц, в то время как остальной шум просто исчез. Это именно то, чего мы намеревались достичь с помощью нашей системы».

Этот подход на основе ИИ может использоваться для повышения качества звука при телефонном разговоре. Опираясь на аналогичные методы распознавания контента, данный алгоритм может идентифицировать говорящего и изолировать его голос от окружающего шума в реальном времени для более чёткой слышимости.

На снимке прототипа системы видно, что к каждой чашке наушников прикреплены микрофоны, подключённые через порт USB к плате OrangePi, которая также передаёт звук на наушники через аудиоразъём. Судя по всему, это одноплатный компьютер OrangePi 5B с чипом Rockchip RK3588S с нейропроцессорным модулем (NPU) с производительностью до 6 TOPS, который и выполняет фильтрацию звуков в реальном времени. Скорее всего, смартфон подключён к компьютеру по беспроводной сети.

Поскольку шумоподавление выполняется в режиме реального времени менее чем за сотую долю секунды, обработку необходимо выполнять на подключённом устройстве, а не в облаке, что делает платы OrangePi идеальными для такой обработки, отметил ресурс Tom's Hardware.

Разработчики утверждают, что данная технология уже может быть реализована на аудиоустройствах и готова к коммерциализации.