Сегодня 09 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Звук и акустика

3D-звук. Часть 1

"3D" в переводе на русский - это три проекции (три измерения). То есть, что-то трехмерное… Давайте рассмотрим, как это возможно реализовать в звуке…

Естественный бинауральный эффект

Строение человеческого слуха подразумевает стереоскопичность восприятия. Давайте проведем параллель с нашими органами зрения. Поднесите палец на расстояние 10 сантиметров от своего носа. Закройте правый глаз, и палец сместится несколько влево, а, закрыв левый глаз, вы получите обратный эффект. Это расстояние разницы между видимыми ощущениями правого и левого глаз именуется параллаксом. Если этот опыт повторить и расположить палец на более дальнее расстояние, параллакс станет меньше. В принципе, это и есть основа нашего трехмерного (3D-видения). Явление параллакса не случайно, поскольку позволяет не только видеть предметы в объеме, но и определять расстояние до них, что, по сути, очень взаимосвязано.

Звук мы также слышим в трехмерном пространстве, используя другие органы - парные органы слуха, но, с некоторым отличием… Воспринимаемый диапазон частот световых волн равен 4 - 7,5 * 10 в четырнадцатой степени Гц, к этому следует прибавить предельную скорость света. Звуковые волны находятся в гораздо более низком диапазоне 20 Гц - 20 КГц и скорость звука намного меньше (ок. 340 м/с). В этом заключается принципиальная разница восприятий.

Если в свете распространены длины волн во много раз меньшие, чем расстояние между глазами и предельная скорость распространения световых волн, то в звуке длины волн на низких частотах превышают расстояние между правым и левым ухом. В результате чего мы в некоторых диапазонах просто физически не можем ощутить слуховой "параллакс" или, как мы его назовем, бинауральную локазацию. Допустим, у нас есть источник, излучающий звук с частотой 20 Гц, при скорости звука в 340 м/с, длина волны будет составлять 17 м (длина волны численно равна частному скорости от частоты или произведению скорости на период).

Среднее расстояние между правым и левым ухом равняется 0,2 м. Соотвественно, если мы повернемся к источнику правой стороной, то временная разница между тем как звук пришел в правое ухо, а потом в левое будет составлять примерно 1,2 % от всего периода 20 Гц волны. Соответственно, ни о какой бинауральной локализации источника и речи быть не может. В диапазоне от 300 до 1000 Гц наш мозг может анализировать фазовый сдвиг и определять локализацию источников звука. С диапазоном выше 1КГц ситуация меняется, поскольку волны с этими частотами начинают быстро затухать и мозг производит больше не фазовую бинауральную локализацию, а амплитудную. В результате, мы имеем три зоны бинауральной локализации и два типа ее осуществления.

В принципе, данный подраздел уже говорит о получении и обработке информации нашим мозгом.

50/50

Джордж Лукас, режиссер и автор "Звездных войн" утверждал, что звук - это 50% человеческого восприятия при просмотре кинокартины, поэтому он разработал стандарт THX, который бы хоть как-нибудь уравновешивал технологии звука в записи и воспроизведении. Лукас был удивлен тому, что звук в студии при монтаже фильма сильно отличается от звука в кинотеатрах… Во-многом, поэтому многоканальные системы стали развиваться в другом направлении. Звукорежиссеры стали изучать психоакустику.

Далее…


Бинауральные модели стали испытываться еще с начала XX века. Вы видите перед собой манекен, где вместо правого и левого уха вставлены микрофоны. На базе анализа входящих данных можно было создать математический алгоритм локализации объектов в реальном пространстве и их человеческих ауральных ощущений. Об этом после…

История

Исследованиями природы звука люди стали заниматься достаточно давно. Догадаться о том, что звук имеет волновую природу совсем нетрудно - достаточно посмотреть на колебания натянутой струны, закрепленной с обоих концов. Первые серьезные исследования в этой области стал проводить Пифагор (6 в. до н. э.), который доказал зависимость высоты тона от длины струны и вывел определенный звукоряд, впоследствии долгое время применявшийся в музыке. Чуть ближе к нам по сетке времени Аристотель, который предположил, что звук - это упругие колебания воздуха. В 18 веке русский ученый М.В. Ломоносов доказал, что газы, в том числе и воздух, обладают свойством упругости. А 1807 год можно считать ключевым в истории звука, поскольку в это время английский ученый Томас Юнг окончательно установил его природу. Причем в качестве подручных средств он использовал шип розы, бокал и закопченое стекло. Прикрепив сургучом шип к бокалу и, направив конец иглы на поверхность стекла, ученый ударил по бокалу, заставив его звенеть и в это время начал смещать стекло. В результате на закопченной поверхности появилась извилистая линия, которая, как мы теперь уже знаем, соответствовала форме звуковой волны. В этом же году, Юнг создал первый самописец, состоящий из камертона и закопченного цилиндра.

Теперь перенесемся во Францию, во Французский Институт. В этом же, 1807 году, математик и физик Жан Батист Жозеф Фурье представляет доклад о синусоидальном представлении температурных распределений. Данная научная работа содержала спорное утверждение о том, что любой непрерывный периодический сигнал может быть представлен суммой выбранных должным образом сигналов синусоидальной формы. К сожалению, эта работа была отклонена, так как против предположения Фурье высказался не менее знаменитый математик Жозеф Луи Лагранж, состоявший тогда в комитете института. Он сказал, что данный метод неприменим к разрывным функциям, например, таким как сигнал прямоугольной формы. В частности правы были оба. Но работа Фурье, ставшая ключевой для современной науки, была издана на много лет позже (в 1822 году), уже после смерти Лагранжа.

В 1827-м известный немецкий физик Георг Ом высказал предположение, что воспринимаемый нами звук - это сумма синусоидальных колебаний, и человеческое ухо способно разлагать его спектр на частотные составляющие (простые тона). Впоследствии это и подтвердилось открытием Фурье, которое применили к описанию звуковых колебаний.

Трехмерная звуковая модель

Окружающие нас звуки имеют сложную структуру, поскольку состоят из множества простых частотных составляющих. Благодаря открытиям Фурье, Ома, Юнга и их последователей мы сейчас имеем дело с современным трехмерным представлением звуковой модели.



Трехмерная модель представления сложной звуковой волны.

Если посмотреть на эту проекцию слева, то можно увидеть амплитудно-временной график, практически тот же, что получил Юнг на самописце, и с которым мы привыкли работать в звуковых редакторах.



Амплитудно-временное представление сложной звуковой волны.

Если будем смотреть справа, то получим спектрограмму (то, что предложил Фурье и предположил Ом).



Амплитудно-частотное представление сложной звуковой волны (спектрограмма).

Продолжение следует…

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
Nvidia выпустила Hotfix-драйвер 610.52 для решения проблем Smooth Motion, G-Sync и ошибок EDID 7 мин.
Кодзима оказался «не заинтересован» в ИИ на фоне массовой критики ИИ-рекламы Prada с его участием 10 мин.
Октябрьский скачок цен на Game Pass обернулся для Xbox потерей «миллионов подписчиков» 2 ч.
Google экстренно обновила Chrome, закрыв уязвимость нулевого дня, которую эксплуатировали хакеры 2 ч.
Продажи Street Fighter 6 превысили 7 млн копий, а в файтинге скоро появится Тифа Локхарт из Final Fantasy VII 3 ч.
Instagram разрешил всем пользователям менять местами публикации в профиле 3 ч.
Apple доверит Google конфиденциальные данные пользователей из Apple Intelligence 3 ч.
Apple Intelligence сможет самостоятельно исправлять скомпрометированные пароли 4 ч.
В России количество атак киберпреступников-вымогателей снизилось, но это лишь передышка 4 ч.
Стартап Perplexity заявил, что не торопится с IPO и проведёт его не ранее 2028 года 4 ч.
Стартовали продажи «Яндекс Дропс» — ИИ-наушников с «Алисой AI» 2 мин.
Sony придумала, как вернуть былую славу смартфонам Xperia — их камеры напичкают ИИ-функциями 4 мин.
Учёные превратили одноразовые стаканчики в поглотители CO2 из воздуха 2 ч.
Илон Маск: у SpaceX уже есть почти все технологии, необходимые для строительства ЦОД в космосе 2 ч.
Акции азиатских ИТ-компаний вернулись к росту после вчерашнего спада 2 ч.
Сначала энергия: Google внедряет в Техасе бизнес-модель Power-First в ответ на дефицит электричества для ЦОД 3 ч.
Apple Watch Series 9 всё же получат обновление до watchOS 27 — Apple признала ошибку 3 ч.
Как в «Безумном Максе»: Meta строит в США «палаточные» ЦОД для ИИ-серверов на миллиарды долларов 3 ч.
Власти США хотят перекрыть китайским компаниям одну из лазеек для получения передовых чипов 4 ч.
InnoGrit представила контроллер для SSD с интерфейсом PCIe 6.0 вместимостью до 256 Тбайт 4 ч.