Сегодня 15 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Звук и акустика

3D-звук. Часть 1

"3D" в переводе на русский - это три проекции (три измерения). То есть, что-то трехмерное… Давайте рассмотрим, как это возможно реализовать в звуке…

Естественный бинауральный эффект

Строение человеческого слуха подразумевает стереоскопичность восприятия. Давайте проведем параллель с нашими органами зрения. Поднесите палец на расстояние 10 сантиметров от своего носа. Закройте правый глаз, и палец сместится несколько влево, а, закрыв левый глаз, вы получите обратный эффект. Это расстояние разницы между видимыми ощущениями правого и левого глаз именуется параллаксом. Если этот опыт повторить и расположить палец на более дальнее расстояние, параллакс станет меньше. В принципе, это и есть основа нашего трехмерного (3D-видения). Явление параллакса не случайно, поскольку позволяет не только видеть предметы в объеме, но и определять расстояние до них, что, по сути, очень взаимосвязано.

Звук мы также слышим в трехмерном пространстве, используя другие органы - парные органы слуха, но, с некоторым отличием… Воспринимаемый диапазон частот световых волн равен 4 - 7,5 * 10 в четырнадцатой степени Гц, к этому следует прибавить предельную скорость света. Звуковые волны находятся в гораздо более низком диапазоне 20 Гц - 20 КГц и скорость звука намного меньше (ок. 340 м/с). В этом заключается принципиальная разница восприятий.

Если в свете распространены длины волн во много раз меньшие, чем расстояние между глазами и предельная скорость распространения световых волн, то в звуке длины волн на низких частотах превышают расстояние между правым и левым ухом. В результате чего мы в некоторых диапазонах просто физически не можем ощутить слуховой "параллакс" или, как мы его назовем, бинауральную локазацию. Допустим, у нас есть источник, излучающий звук с частотой 20 Гц, при скорости звука в 340 м/с, длина волны будет составлять 17 м (длина волны численно равна частному скорости от частоты или произведению скорости на период).

Среднее расстояние между правым и левым ухом равняется 0,2 м. Соотвественно, если мы повернемся к источнику правой стороной, то временная разница между тем как звук пришел в правое ухо, а потом в левое будет составлять примерно 1,2 % от всего периода 20 Гц волны. Соответственно, ни о какой бинауральной локализации источника и речи быть не может. В диапазоне от 300 до 1000 Гц наш мозг может анализировать фазовый сдвиг и определять локализацию источников звука. С диапазоном выше 1КГц ситуация меняется, поскольку волны с этими частотами начинают быстро затухать и мозг производит больше не фазовую бинауральную локализацию, а амплитудную. В результате, мы имеем три зоны бинауральной локализации и два типа ее осуществления.

В принципе, данный подраздел уже говорит о получении и обработке информации нашим мозгом.

50/50

Джордж Лукас, режиссер и автор "Звездных войн" утверждал, что звук - это 50% человеческого восприятия при просмотре кинокартины, поэтому он разработал стандарт THX, который бы хоть как-нибудь уравновешивал технологии звука в записи и воспроизведении. Лукас был удивлен тому, что звук в студии при монтаже фильма сильно отличается от звука в кинотеатрах… Во-многом, поэтому многоканальные системы стали развиваться в другом направлении. Звукорежиссеры стали изучать психоакустику.

Далее…


Бинауральные модели стали испытываться еще с начала XX века. Вы видите перед собой манекен, где вместо правого и левого уха вставлены микрофоны. На базе анализа входящих данных можно было создать математический алгоритм локализации объектов в реальном пространстве и их человеческих ауральных ощущений. Об этом после…

История

Исследованиями природы звука люди стали заниматься достаточно давно. Догадаться о том, что звук имеет волновую природу совсем нетрудно - достаточно посмотреть на колебания натянутой струны, закрепленной с обоих концов. Первые серьезные исследования в этой области стал проводить Пифагор (6 в. до н. э.), который доказал зависимость высоты тона от длины струны и вывел определенный звукоряд, впоследствии долгое время применявшийся в музыке. Чуть ближе к нам по сетке времени Аристотель, который предположил, что звук - это упругие колебания воздуха. В 18 веке русский ученый М.В. Ломоносов доказал, что газы, в том числе и воздух, обладают свойством упругости. А 1807 год можно считать ключевым в истории звука, поскольку в это время английский ученый Томас Юнг окончательно установил его природу. Причем в качестве подручных средств он использовал шип розы, бокал и закопченое стекло. Прикрепив сургучом шип к бокалу и, направив конец иглы на поверхность стекла, ученый ударил по бокалу, заставив его звенеть и в это время начал смещать стекло. В результате на закопченной поверхности появилась извилистая линия, которая, как мы теперь уже знаем, соответствовала форме звуковой волны. В этом же году, Юнг создал первый самописец, состоящий из камертона и закопченного цилиндра.

Теперь перенесемся во Францию, во Французский Институт. В этом же, 1807 году, математик и физик Жан Батист Жозеф Фурье представляет доклад о синусоидальном представлении температурных распределений. Данная научная работа содержала спорное утверждение о том, что любой непрерывный периодический сигнал может быть представлен суммой выбранных должным образом сигналов синусоидальной формы. К сожалению, эта работа была отклонена, так как против предположения Фурье высказался не менее знаменитый математик Жозеф Луи Лагранж, состоявший тогда в комитете института. Он сказал, что данный метод неприменим к разрывным функциям, например, таким как сигнал прямоугольной формы. В частности правы были оба. Но работа Фурье, ставшая ключевой для современной науки, была издана на много лет позже (в 1822 году), уже после смерти Лагранжа.

В 1827-м известный немецкий физик Георг Ом высказал предположение, что воспринимаемый нами звук - это сумма синусоидальных колебаний, и человеческое ухо способно разлагать его спектр на частотные составляющие (простые тона). Впоследствии это и подтвердилось открытием Фурье, которое применили к описанию звуковых колебаний.

Трехмерная звуковая модель

Окружающие нас звуки имеют сложную структуру, поскольку состоят из множества простых частотных составляющих. Благодаря открытиям Фурье, Ома, Юнга и их последователей мы сейчас имеем дело с современным трехмерным представлением звуковой модели.



Трехмерная модель представления сложной звуковой волны.

Если посмотреть на эту проекцию слева, то можно увидеть амплитудно-временной график, практически тот же, что получил Юнг на самописце, и с которым мы привыкли работать в звуковых редакторах.



Амплитудно-временное представление сложной звуковой волны.

Если будем смотреть справа, то получим спектрограмму (то, что предложил Фурье и предположил Ом).



Амплитудно-частотное представление сложной звуковой волны (спектрограмма).

Продолжение следует…

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
Представлена обновлённая платформа «Яндекс Авто» с расширенными возможностями «Алисы» 2 ч.
«Яндекс» научил «Алису» рассуждать, работать с файлами, говорить по-английски, изучать мир и заниматься с детьми 3 ч.
В открытый доступ попали первые скриншоты The Elder Scrolls IV: Oblivion Remastered — официального ремейка культовой RPG от Bethesda 3 ч.
Япония предписала Google прекратить навязывание своих приложений производителям смартфонов 5 ч.
Obsidian рассказала о широте ролевых возможностей в The Outer Worlds 2 — игроки смогут отыгрывать серийного убийцу и не только 5 ч.
Датамайнер рассказала о самом большом неиспользованном боссе в играх FromSoftware — он мог появиться в Sekiro: Shadows Die Twice 6 ч.
В деле об отделении Instagram и WhatsApp от Meta появилась веская улика — компрометирующее письмо Цукерберга от 2012 года 6 ч.
ИИ-модели Gemini позволили анализировать снимки в «Google Фото», но пока не у всех пользователей 6 ч.
«Абсолютно завораживающий опыт»: эксперт Digital Foundry протестировал Cyberpunk 2077 на Nintendo Switch 2 7 ч.
К Apple подали ещё два иска за невыполненные обещания по ИИ-функциям Apple Intelligence 8 ч.
Palit представила GeForce RTX 5060 Ti и RTX 5060 в версиях Infinity 3 и Dual — последняя выделяется компактностью 2 ч.
«Яндекс» представила «Станцию Мини 3 Про» с поддержкой Zigbee и подключаемыми модулями 3 ч.
«Рикор» представила Rikor Pro 7 — лёгкий и мощный ноутбук для бизнеса 3 ч.
Учёные МФТИ построили литограф для создания 3D-микроструктур с элементами размером 150 нм 3 ч.
«Яндекс» представила первую в России портативную умную колонку — «Станцию Стрит» с «Алисой» 3 ч.
«Яндекс» представила свою первую умную IP-камеру для дома 3 ч.
США призвали Европу сделать выбор между американскими и китайскими технологиями связи 3 ч.
ИБП Google Cloud стали причиной… шестичасового перебоя в электроснабжении одного из облачных регионов 4 ч.
Caviar представила OVI 8 — спецверсию iPhone в честь Александра Овечкина за 650 тыс. рублей 5 ч.
МТС придумала, как сэкономить на развёртывании сетей 5G 5 ч.