Sensaura 3DPA: краткое описание стандарта / Звук и акустика

В данной статье мы вкратце познакомим читателя с еще одним игроком на арене стандартов трехмерного звука для РС: звуковым API от компании Sensaura, который носит незамысловатое название 3DPA (3-Dimentions Positional Audio, "Трехмерное позиционирование звука"). К написанию этой статьи нас подтолкнуло знакомство со звуковым комплектом от Hercules: Game Theater XP. Напомним, что в основе этого комплекта лежит чип CrystalSound CS4630 от CirrusLogic, который поддерживает API Sensaura 3DPA.

Общее описание

Sensaura 3DPA является современным стандартом трехмерного звука, предназначенным для использования в PC и бытовой электронике. Стандарт поддерживает основные функции и эффекты EAX 1.0 и 2.0, A3D, DirectSound 3D и I3DL2, привнося при этом ряд дополнительных патентованных технологий, нацеленных на придание максимального реализма и точности трехмерного позиционирования звука.

Компоненты и технологии

EnvironmentFX

Этот модуль предназначен для моделирования эффектов окружающей среды. Алгоритмы EnvironmentFX полностью совместимы со спецификациями Creative Technology EAX и могут вызываться через этот API, а его функции реализованы как расширение набора свойств MS DirectSound 3D API.

Алгоритмы и свойства:

Соотношение прямого и отраженного звука – позволяет создавать эффект различного расстояния до источника звука
Размер помещения – время, за которое ранние отраженные волны входят в резонанс и формируют диффузионную реверберацию
Усечение высоких частот – позволяет эмулировать материалы с различными порогами поглощения высокочастотных звуков
Уровень ранних отраженных волн – позволяет моделировать количество звукоотражающих объектов и их близость к слушателю
Уровень реверберации – позволяет моделировать помещения с различными геометрическими акустическими свойствами
Время затухания отраженных волн – позволяет моделировать комплекс акустических свойств, сочетающих размер помещения и звукоотражающие свойства материалов, а также время рассеивания в воздухе (иной среде)
Время затухания высокочастотных звуков – способ моделирования различной степени поглощения высоких частот материалами
Плотность отраженных волн – позволяет передать количество звукоотражающих поверхностей в помещении
Рассеивание – позволяет моделировать степень рассеивания и декорреляции волн сильно несимметричными отражающими поверхностями
Изменение тона – позволяет эмулировать изменение высоты тона отраженных волн при отражении от движущихся поверхностей (деревья на ветру, вода, движущееся препятствие)

В будущих планах компании – введение дополнительных функций моделирования окружающей среды, таких, как обструкция, окклюзия, система динамического контроля параметров помещения, и т. д.

MacroFX

Патентованная технология создания эффектов ближнего звукового поля, призванная имитировать нахождение источника звука в непосредственной близости возле головы (ушей) слушателя.

Для этого используется специальный алгоритм HRTF (Head Related Transfer Function, "Передача звука в привязке к голове"), учитывающий анатомические и нейропсихические параметры восприятия звука человеком, в том числе:

IAD (Inter-Aural Amplitude Difference) – меж-ушная амплитудная разница
ITD (Inter-Aural Time Difference) – меж-ушная задержка
Spectral Shaping – формирование спектра звука в зависимости от формы внешнего уха.

Создание эффектов ближнего поля таит в себе определенные трудности. При воспроизведении звука через наушники акустическая информация подается непосредственно в уши слушателя, что позволяет достичь полной имитации близкорасположенного источника звука. Однако при воспроизведении через динамики возникает целый ряд сложностей.

Во-первых, в дело вступает эффект перекрестного проникновения: независимо от раскладки стереоканалов, правое ухо всегда слышит часть звуковой информации левого канала, и наоборот. Для борьбы с этим явлением используются специальные сигналы подавления перекрестного проникновения, совпадающие по частоте, имеющие скорректированную амплитуду, но инвертированные по фазе относительно проникающего сигнала.

Во-вторых, имитация пространственного положения источника звука не всегда достигается одинаково просто. Так, сделать четкое различие между звуком непосредственно перед и непосредственно позади головы слушателя намного труднее, чем справа или слева. Это связано с тем, что в первом случае невозможно использовать факторы IAD и ITD, так как они будут равны нулю: звук в оба уха поступает с одинаковой громкостью и в одно время. Единственный работающий фактор – форма спектра, так как при источнике точно позади головы слушателя часть высоких частот отражается и поглощается внешней стенкой ушной раковины.

Алгоритм MacroFX учитывает все эти сложные аспекты восприятия, и позволяет создавать реалистичные эффекты нахождения источников звука непосредственно у головы слушателя. Звуковое пространство делится на пять четких зон:

Sound zones

Зона 1: средняя удаленность (1-5 м. от головы слушателя)
Зона 2: ближнее звуковое поле (до 1 м. от головы слушателя)
Зоны 3 и 4: непосредственно у уха слушателя
Зона 5: внутри головы

Основной сферой применения являются компьютерные игры. Разработчики могут выбрать один из десяти предустановленных эффектов библиотеки MacroFX, включая следующие:

шепот на ухо
имитация переговоров в наушниках
свист ветра
пролет в непосредственной близости (пули, камни, птицы, насекомые и т. д.)

ZoomFX

Технология передачи размеров объектов, издающих звук, и комплекса суб-источников звука на одном объекте.

В настоящее время все технологии трехмерного позиционирования звука рассматривают объекты звуковой картины как точечные источники звука. Конечно, в реальной жизни это не так. Говоря упрощенно, звуковое поле создается неким пространственным элементом, как минимум двумерным (поверхностью) или даже трехмерным (объемом).

Однако в виртуальном мире объемного звука не все источники звука необходимо трактовать как "размерные" объекты. Некоторые могут оставаться точечными, не нанося ущерба реалистичности звуковой картины.

В качестве отправного параметра был выбран угол звуковой проекции на голову слушателя:

Subtended Angle

Экспериментальным путем было установлено, что минимальный угол, при котором человеческий мозг начинает четко и ясно различать пространственные размеры излучателя звука, составляет около 20 градусов. Поэтому разработчиками ZoomFX было принято решение считать источники звука, дающие угол проекции менее 20 град, точечными, а остальные – площадными.

Как понятно из диаграммы и базовых знаний геометрии, угол проекции зависит не только от физических размеров объекта, но и от его удаленности от слушателя. Так, лошадь, скачущая в двух метрах от слушателя, будет считаться площадным объектом, тогда как едущий танк на расстоянии 200 метров – точечным.

Другим аспектом является комплексный источник звука - объект, сочетающий в себе несколько отдельных источников звука, разнесенных в пространстве. В качестве примера рассмотрим летящий вертолет. В жизни вертолет является комплексным источником, и сочетает в себе звуки, издаваемые концами лопастей несущего винта, рев сопла турбины и звук хвостового винта.

Helicopter

В традиционных системах трехмерного позиционирования вертолет рассматривался как точечный источник звука, издающий весь этот комплекс из одной точки в пространстве. Технология ZoomFX позволяет разнести эти точечные источники звука в пространстве для создания эффекта близости комплексного источника звука. Подобное вычленение отдельных звуков из комплексного источника было названо декорреляцией.

Однако пространственная характеристика звукоизлучающего объекта меняется по мере его перемещения относительно слушателя, равно как и информация о суб-источниках. В связи с этим возникла необходимость динамической корректировки этих параметров. В двух словах, по мере приближения объекта к слушателю система выделяет дополнительные источники звука этого объекта и разносит их в пространстве. По мере же удаления происходит обратный процесс, и в итоге источник опять превращается в точечный. Этот алгоритм был назван динамической декорреляцией, а получаемый в результате реалистичный образ приближающегося или удаляющегося объекта с ощущением изменения его кажущегося размера получил наименование Audio Zoom.

Audio Zoom

Технология ZoomFX может также использоваться для лучшей визуализации стерео, Dolby Prologic и Dolby Digital при прослушивании в наушниках, путем создания дополнительных "виртуальных" источников звука и, тем самым, восстанавливая частичную потерю локализации и объема по сравнению с акустическими системами с несколькими динамиками.

MultiDrive

Патентованная технология воспроизведения трехмерного звука на 4 или 5 динамиков.

Основная задача данной системы – создание настоящей трехмерной звуковой картины и увеличение зоны оптимального прослушивания (Sweet Spot).

В обычных системах трехмерного позиционирования звука пространственная информация кодируется относительной громкостью воспроизведения виртуального источника в соответствующих каналах. Однако у такой системы есть ряд существенных недостатков. Во-первых, созданию правильной пространственной картины мешает т. н. Эффект Хааса (Haas Effect), называемый также "эффект предшествования" или "правило первой звуковой волны". Он заключается в следующем: человеческий мозг составляет представление о пространственном положении источника звука прежде всего по времени получения звукового сигнала, и лишь затем учитывает его громкость.

На практике это означает, что если слушатель находится не точно в центре зоны оптимального прослушивания, то его восприятие пространственного положения звука, кодированного громкостью, искажается в зависимости от того, к какому из динамиков смещен пользователь:

On axis

Желаемая звуковая картина

Off axis

Реальная звуковая картина

Экспериментальным путем было установлено, что смещение слушателя к одному из динамиков, и, как следствие, возникающий эффект Хааса, может скомпенсировать разницу в громкости вплоть до 8 dB, то есть слушатель, находясь ближе к существенно более тихому динамику, все равно будет полагать, что источник звука расположен именно с этой стороны.

Точно такие же ограничения распространяются и на позиционирование звука между фронтом и тылом. В итоге зона оптимального прослушивания в классических четырехканальных системах трехмерного звука очень ограничена, и смещение слушателя приводит к искажению пространственного звукового образа.

Sweetspot

Другая проблема, возникающая в классических системах, связана с эффектом перекрестного проникновения каналов (подробнее см. раздел о MacroFX). Используемые для подавления этого эффекта специальные инвертированные по фазе сигналы, особенно высокочастотные, сильно зависят от взаимного расположения источников звука и слушателя. Так как высокочастотные звуки (в том числе и сигналы подавления перекрестного проникновения) способствуют сильной локализации источника, очень часто при смещении слушателя из зоны оптимального прослушивания такие сигналы перестают выполнять функцию компенсации проникающего сигнала, и превращаются в отдельный звук, явственно исходящий из динамиков.

Все это сильно затрудняет достижение правильной локализации звука, особенно позади слушателя, где часть высоких частот отражается задней стенкой ушной раковины, затрудняя получение пространственной информации.

Технология Sensaura MultiDrive нацелена на решение этих проблем. Так, при осуществлении трехмерного позиционирования звука MultiDrive использует фронтальную и тыловую пары колонок для создания двух полусфер звукового поля: передней и задней. Вводится соответствующая временная задержка для устранения эффекта Хааса. Обе полусферы плавно совмещаются, обеспечивая более сглаженное перемещение виртуальных источников звука вокруг слушателя. Благодаря этому, зона оптимального прослушивания становится заметно больше, и имеет особенно высокий допуск по продольному смещению:

MultiDrive Sweetspot

Тыловой канал работает по специальному фирменному алгоритму подавления взаимного проникновения – Sensaura TCC, позволяя добиться четкой локализации звуков, возникающих позади слушателя, в том числе и высокочастотных эффектов.

Технология MultiDrive также поддерживает все эффекты ZoomFX и MacroFX.

Выводы

Sensaura 3DPA – безусловно, очень интересный стандарт трехмерного звука. Повышенное внимание биологическим и психологическим аспектам восприятия звука человеком может позволить поднять уровень реализма объемного звука на следующую качественную ступеньку.

Стандарт еще достаточно молод, и о его прямой поддержке в играх пока говорить рано. Однако если вспомнить, как быстро стал отраслевым стандартом тот же EAX, можно надеяться, что в обозримом будущем нам представится возможность оценить все эти интересные технологические разработки в деле.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Материалы по теме

Космический корабль NASA Orion полностью заправлен для полёта с людьми к Луне

Истреблять фашистскую нечисть теперь можно на родном языке: спустя 11 лет Wolfenstein: The New Order получила профессиональную русскую озвучку

В воскресный полдень рядом с Землёй пролетит астероид размерами с 15-этажный дом

Sensaura 3DPA: краткое описание стандарта

Общее описание

Компоненты и технологии

Выводы