Сегодня 01 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Звук и акустика

3D-звук. Часть 1

"3D" в переводе на русский - это три проекции (три измерения). То есть, что-то трехмерное… Давайте рассмотрим, как это возможно реализовать в звуке…

Естественный бинауральный эффект

Строение человеческого слуха подразумевает стереоскопичность восприятия. Давайте проведем параллель с нашими органами зрения. Поднесите палец на расстояние 10 сантиметров от своего носа. Закройте правый глаз, и палец сместится несколько влево, а, закрыв левый глаз, вы получите обратный эффект. Это расстояние разницы между видимыми ощущениями правого и левого глаз именуется параллаксом. Если этот опыт повторить и расположить палец на более дальнее расстояние, параллакс станет меньше. В принципе, это и есть основа нашего трехмерного (3D-видения). Явление параллакса не случайно, поскольку позволяет не только видеть предметы в объеме, но и определять расстояние до них, что, по сути, очень взаимосвязано.

Звук мы также слышим в трехмерном пространстве, используя другие органы - парные органы слуха, но, с некоторым отличием… Воспринимаемый диапазон частот световых волн равен 4 - 7,5 * 10 в четырнадцатой степени Гц, к этому следует прибавить предельную скорость света. Звуковые волны находятся в гораздо более низком диапазоне 20 Гц - 20 КГц и скорость звука намного меньше (ок. 340 м/с). В этом заключается принципиальная разница восприятий.

Если в свете распространены длины волн во много раз меньшие, чем расстояние между глазами и предельная скорость распространения световых волн, то в звуке длины волн на низких частотах превышают расстояние между правым и левым ухом. В результате чего мы в некоторых диапазонах просто физически не можем ощутить слуховой "параллакс" или, как мы его назовем, бинауральную локазацию. Допустим, у нас есть источник, излучающий звук с частотой 20 Гц, при скорости звука в 340 м/с, длина волны будет составлять 17 м (длина волны численно равна частному скорости от частоты или произведению скорости на период).

Среднее расстояние между правым и левым ухом равняется 0,2 м. Соотвественно, если мы повернемся к источнику правой стороной, то временная разница между тем как звук пришел в правое ухо, а потом в левое будет составлять примерно 1,2 % от всего периода 20 Гц волны. Соответственно, ни о какой бинауральной локализации источника и речи быть не может. В диапазоне от 300 до 1000 Гц наш мозг может анализировать фазовый сдвиг и определять локализацию источников звука. С диапазоном выше 1КГц ситуация меняется, поскольку волны с этими частотами начинают быстро затухать и мозг производит больше не фазовую бинауральную локализацию, а амплитудную. В результате, мы имеем три зоны бинауральной локализации и два типа ее осуществления.

В принципе, данный подраздел уже говорит о получении и обработке информации нашим мозгом.

50/50

Джордж Лукас, режиссер и автор "Звездных войн" утверждал, что звук - это 50% человеческого восприятия при просмотре кинокартины, поэтому он разработал стандарт THX, который бы хоть как-нибудь уравновешивал технологии звука в записи и воспроизведении. Лукас был удивлен тому, что звук в студии при монтаже фильма сильно отличается от звука в кинотеатрах… Во-многом, поэтому многоканальные системы стали развиваться в другом направлении. Звукорежиссеры стали изучать психоакустику.

Далее…


Бинауральные модели стали испытываться еще с начала XX века. Вы видите перед собой манекен, где вместо правого и левого уха вставлены микрофоны. На базе анализа входящих данных можно было создать математический алгоритм локализации объектов в реальном пространстве и их человеческих ауральных ощущений. Об этом после…

История

Исследованиями природы звука люди стали заниматься достаточно давно. Догадаться о том, что звук имеет волновую природу совсем нетрудно - достаточно посмотреть на колебания натянутой струны, закрепленной с обоих концов. Первые серьезные исследования в этой области стал проводить Пифагор (6 в. до н. э.), который доказал зависимость высоты тона от длины струны и вывел определенный звукоряд, впоследствии долгое время применявшийся в музыке. Чуть ближе к нам по сетке времени Аристотель, который предположил, что звук - это упругие колебания воздуха. В 18 веке русский ученый М.В. Ломоносов доказал, что газы, в том числе и воздух, обладают свойством упругости. А 1807 год можно считать ключевым в истории звука, поскольку в это время английский ученый Томас Юнг окончательно установил его природу. Причем в качестве подручных средств он использовал шип розы, бокал и закопченое стекло. Прикрепив сургучом шип к бокалу и, направив конец иглы на поверхность стекла, ученый ударил по бокалу, заставив его звенеть и в это время начал смещать стекло. В результате на закопченной поверхности появилась извилистая линия, которая, как мы теперь уже знаем, соответствовала форме звуковой волны. В этом же году, Юнг создал первый самописец, состоящий из камертона и закопченного цилиндра.

Теперь перенесемся во Францию, во Французский Институт. В этом же, 1807 году, математик и физик Жан Батист Жозеф Фурье представляет доклад о синусоидальном представлении температурных распределений. Данная научная работа содержала спорное утверждение о том, что любой непрерывный периодический сигнал может быть представлен суммой выбранных должным образом сигналов синусоидальной формы. К сожалению, эта работа была отклонена, так как против предположения Фурье высказался не менее знаменитый математик Жозеф Луи Лагранж, состоявший тогда в комитете института. Он сказал, что данный метод неприменим к разрывным функциям, например, таким как сигнал прямоугольной формы. В частности правы были оба. Но работа Фурье, ставшая ключевой для современной науки, была издана на много лет позже (в 1822 году), уже после смерти Лагранжа.

В 1827-м известный немецкий физик Георг Ом высказал предположение, что воспринимаемый нами звук - это сумма синусоидальных колебаний, и человеческое ухо способно разлагать его спектр на частотные составляющие (простые тона). Впоследствии это и подтвердилось открытием Фурье, которое применили к описанию звуковых колебаний.

Трехмерная звуковая модель

Окружающие нас звуки имеют сложную структуру, поскольку состоят из множества простых частотных составляющих. Благодаря открытиям Фурье, Ома, Юнга и их последователей мы сейчас имеем дело с современным трехмерным представлением звуковой модели.



Трехмерная модель представления сложной звуковой волны.

Если посмотреть на эту проекцию слева, то можно увидеть амплитудно-временной график, практически тот же, что получил Юнг на самописце, и с которым мы привыкли работать в звуковых редакторах.



Амплитудно-временное представление сложной звуковой волны.

Если будем смотреть справа, то получим спектрограмму (то, что предложил Фурье и предположил Ом).



Амплитудно-частотное представление сложной звуковой волны (спектрограмма).

Продолжение следует…

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
Microsoft выпустила публичное превью WSL Containers для запуска контейнеров Linux в Windows 3 ч.
Уязвимость BlueHammer в Windows Defender не потеряла актуальность, несмотря на апрельский патч 3 ч.
Журналисты раскрыли масштаб будущих увольнений в Xbox — под угрозой закрытия оказалась даже Arkane Studios и её Marvel’s Blade 4 ч.
ИИ научили говорить как пещерный человек — чтобы экономить миллионы на токенах 5 ч.
Meta не сумела отделаться от иска о детской зависимости от соцсетей — суд состоится 18 августа 7 ч.
Улыбаемся и машем: Quantic Dream отвергла опасения работников о судьбе Star Wars Eclipse 7 ч.
Последняя игра легендарного арт-директора Half-Life 2 отправит геймеров в апокалиптический вестерн — первый трейлер и детали Guns of Eschaton 8 ч.
Релиз российской ОС SelectOS 2.0: повышенная защищённость и поддержка ИИ-нагрузок 8 ч.
Соавтор Dragon Age назвал ИИ «страшной чумой», которая мешает разработчикам осваивать ремесло создания игр 9 ч.
Вышло официальное приложение OpenClaw для управления ИИ-агентами со смартфона 10 ч.
Новая статья: Ryzen и двухранговая DDR5: проверяем комплект G.Skill Trident Z5 Royal DDR5-6400 CL32 64GB 2 ч.
Южная Корея инвестирует почти $3 трлн в полупроводники и ИИ 3 ч.
Titan Army показала безочковый 3D-монитор M27E6V-3D с 4K, 190 Гц и очень высокой яркостью для геймеров 5 ч.
В эпоху «автоматизированной дезинформации» стало слишком легко заявлять об обнаружении инопланетян 8 ч.
Xiaomi выпустила смартфон Redmi K90 Ultra — Snapdragon 8 Elite, вентилятор и батарея на 8550 мА·ч по цене от $420 8 ч.
Проприетарные беспроводные зарядки скоро канут в Лету — на подходе единый стандарт Qi 50 Вт 8 ч.
Грядущие складные смартфоны Samsung Galaxy Z 8 Fold и Flip показались до анонса 9 ч.
Первые модули DDR5 с поддержкой AMD EXPO Ultra Low Latency оказались до 79 % дороже обычных 10 ч.
Firmus при поддержке NVIDIA развернёт в Индонезии ИИ-кластер из 170 тыс. ускорителей 11 ч.
Dreame выпустила в России робот-пылесос L60 Pro Ultra за 110 тыс. рублей 11 ч.