Сегодня 01 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Звук и акустика

3D-звук. Часть 1

"3D" в переводе на русский - это три проекции (три измерения). То есть, что-то трехмерное… Давайте рассмотрим, как это возможно реализовать в звуке…

Естественный бинауральный эффект

Строение человеческого слуха подразумевает стереоскопичность восприятия. Давайте проведем параллель с нашими органами зрения. Поднесите палец на расстояние 10 сантиметров от своего носа. Закройте правый глаз, и палец сместится несколько влево, а, закрыв левый глаз, вы получите обратный эффект. Это расстояние разницы между видимыми ощущениями правого и левого глаз именуется параллаксом. Если этот опыт повторить и расположить палец на более дальнее расстояние, параллакс станет меньше. В принципе, это и есть основа нашего трехмерного (3D-видения). Явление параллакса не случайно, поскольку позволяет не только видеть предметы в объеме, но и определять расстояние до них, что, по сути, очень взаимосвязано.

Звук мы также слышим в трехмерном пространстве, используя другие органы - парные органы слуха, но, с некоторым отличием… Воспринимаемый диапазон частот световых волн равен 4 - 7,5 * 10 в четырнадцатой степени Гц, к этому следует прибавить предельную скорость света. Звуковые волны находятся в гораздо более низком диапазоне 20 Гц - 20 КГц и скорость звука намного меньше (ок. 340 м/с). В этом заключается принципиальная разница восприятий.

Если в свете распространены длины волн во много раз меньшие, чем расстояние между глазами и предельная скорость распространения световых волн, то в звуке длины волн на низких частотах превышают расстояние между правым и левым ухом. В результате чего мы в некоторых диапазонах просто физически не можем ощутить слуховой "параллакс" или, как мы его назовем, бинауральную локазацию. Допустим, у нас есть источник, излучающий звук с частотой 20 Гц, при скорости звука в 340 м/с, длина волны будет составлять 17 м (длина волны численно равна частному скорости от частоты или произведению скорости на период).

Среднее расстояние между правым и левым ухом равняется 0,2 м. Соотвественно, если мы повернемся к источнику правой стороной, то временная разница между тем как звук пришел в правое ухо, а потом в левое будет составлять примерно 1,2 % от всего периода 20 Гц волны. Соответственно, ни о какой бинауральной локализации источника и речи быть не может. В диапазоне от 300 до 1000 Гц наш мозг может анализировать фазовый сдвиг и определять локализацию источников звука. С диапазоном выше 1КГц ситуация меняется, поскольку волны с этими частотами начинают быстро затухать и мозг производит больше не фазовую бинауральную локализацию, а амплитудную. В результате, мы имеем три зоны бинауральной локализации и два типа ее осуществления.

В принципе, данный подраздел уже говорит о получении и обработке информации нашим мозгом.

50/50

Джордж Лукас, режиссер и автор "Звездных войн" утверждал, что звук - это 50% человеческого восприятия при просмотре кинокартины, поэтому он разработал стандарт THX, который бы хоть как-нибудь уравновешивал технологии звука в записи и воспроизведении. Лукас был удивлен тому, что звук в студии при монтаже фильма сильно отличается от звука в кинотеатрах… Во-многом, поэтому многоканальные системы стали развиваться в другом направлении. Звукорежиссеры стали изучать психоакустику.

Далее…


Бинауральные модели стали испытываться еще с начала XX века. Вы видите перед собой манекен, где вместо правого и левого уха вставлены микрофоны. На базе анализа входящих данных можно было создать математический алгоритм локализации объектов в реальном пространстве и их человеческих ауральных ощущений. Об этом после…

История

Исследованиями природы звука люди стали заниматься достаточно давно. Догадаться о том, что звук имеет волновую природу совсем нетрудно - достаточно посмотреть на колебания натянутой струны, закрепленной с обоих концов. Первые серьезные исследования в этой области стал проводить Пифагор (6 в. до н. э.), который доказал зависимость высоты тона от длины струны и вывел определенный звукоряд, впоследствии долгое время применявшийся в музыке. Чуть ближе к нам по сетке времени Аристотель, который предположил, что звук - это упругие колебания воздуха. В 18 веке русский ученый М.В. Ломоносов доказал, что газы, в том числе и воздух, обладают свойством упругости. А 1807 год можно считать ключевым в истории звука, поскольку в это время английский ученый Томас Юнг окончательно установил его природу. Причем в качестве подручных средств он использовал шип розы, бокал и закопченое стекло. Прикрепив сургучом шип к бокалу и, направив конец иглы на поверхность стекла, ученый ударил по бокалу, заставив его звенеть и в это время начал смещать стекло. В результате на закопченной поверхности появилась извилистая линия, которая, как мы теперь уже знаем, соответствовала форме звуковой волны. В этом же году, Юнг создал первый самописец, состоящий из камертона и закопченного цилиндра.

Теперь перенесемся во Францию, во Французский Институт. В этом же, 1807 году, математик и физик Жан Батист Жозеф Фурье представляет доклад о синусоидальном представлении температурных распределений. Данная научная работа содержала спорное утверждение о том, что любой непрерывный периодический сигнал может быть представлен суммой выбранных должным образом сигналов синусоидальной формы. К сожалению, эта работа была отклонена, так как против предположения Фурье высказался не менее знаменитый математик Жозеф Луи Лагранж, состоявший тогда в комитете института. Он сказал, что данный метод неприменим к разрывным функциям, например, таким как сигнал прямоугольной формы. В частности правы были оба. Но работа Фурье, ставшая ключевой для современной науки, была издана на много лет позже (в 1822 году), уже после смерти Лагранжа.

В 1827-м известный немецкий физик Георг Ом высказал предположение, что воспринимаемый нами звук - это сумма синусоидальных колебаний, и человеческое ухо способно разлагать его спектр на частотные составляющие (простые тона). Впоследствии это и подтвердилось открытием Фурье, которое применили к описанию звуковых колебаний.

Трехмерная звуковая модель

Окружающие нас звуки имеют сложную структуру, поскольку состоят из множества простых частотных составляющих. Благодаря открытиям Фурье, Ома, Юнга и их последователей мы сейчас имеем дело с современным трехмерным представлением звуковой модели.



Трехмерная модель представления сложной звуковой волны.

Если посмотреть на эту проекцию слева, то можно увидеть амплитудно-временной график, практически тот же, что получил Юнг на самописце, и с которым мы привыкли работать в звуковых редакторах.



Амплитудно-временное представление сложной звуковой волны.

Если будем смотреть справа, то получим спектрограмму (то, что предложил Фурье и предположил Ом).



Амплитудно-частотное представление сложной звуковой волны (спектрограмма).

Продолжение следует…

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
МТС Web Services запустила B2B-платформу MWS Data с ИИ-агентами для работы с большими данными 50 мин.
Electronic Arts опубликовала тизер первой за 16 лет новой NCAA March Madness — 2K тоже дразнит фанатов возвращением в игру 58 мин.
Будущее Halo прояснится в октябре, и фанаты «не захотят пропускать» это 3 ч.
Запуски ракет NASA и работу астронавтов в открытом космосе начнут показывать на Netflix 3 ч.
Siri может поумнеть с помощью ИИ OpenAI или Anthropic — у Apple не получается обучить достойный ИИ самостоятельно 3 ч.
Warhammer 40,000: Space Marine 2 продолжит получать новый контент — подробности крупного обновления 10.0 4 ч.
«Яндекс» открыл бесплатный доступ к своей лучшей нейросети YandexGPT 5 Pro через «Чат с Алисой» 4 ч.
Стартапу xAI Илона Маска удалось недавно привлечь в общей сложности $10 млрд 7 ч.
Руководство OpenAI признало, что конкуренция за ценные кадры вынуждает его шевелиться 11 ч.
Марк Цукерберг собрал звёздную команду для разработки суперинтеллекта 12 ч.
Трамп пообещал сэкономить состояние для США, отменив субсидии компаниям Илона Маска 11 мин.
Xiaomi распродала все электромобили YU7 на год вперёд — и вызвала гнев сотен покупателей 2 ч.
Обновление системы резервного копирования TATLIN.BACKUP для защиты данных от вирусов-шифровальщиков 2 ч.
HPE продаст Instant On, чтобы купить Juniper, а Juniper лицензирует Mist, чтобы продаться HPE 2 ч.
В России запретят называть отечественными чипы, произведённые за границей — статус Baikal и «Эльбрус» под угрозой 3 ч.
Xiaomi задействовала 1000 роботов и передовые технологии для сборки электромобилей 3 ч.
Google договорилась о покупке термоядерной энергии у детища MIT — Commonwealth Fusion Systems 4 ч.
Россияне стали чаще покупать ноутбуки без операционной системы — так дешевле 4 ч.
Blue Origin в 13-й раз свозила туристов на границу космоса — и 1000 открыток в придачу 4 ч.
Amazon запустила инстансы EC2 C8gn с чипами Graviton4 для требовательных сетевых нагрузок 5 ч.