Сегодня 23 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Угадай мелодию, или Системы идентификации музыкальных композиций

Любителей слушать музыку несть числа. Для одних меломанов она является источником вдохновения и играет важную роль в жизни, другим она позволяет расслабиться и собраться с мыслями, а третьим - увидеть в ней отражение собственных эмоций и переживаний. Немало находится и тех, для кого данный вид искусства является лишь средством развлечения, скрашивающим суровые будни и заставляющим изредка ломать голову над идентификацией той или иной композиции, доносящейся из колонок или наушников. Да что говорить, наверняка, каждый из читателей 3DNews хоть раз да сталкивался с ситуацией, когда по радио звучит красивая мелодия, а вспомнить ее название и исполнителя (для последующего пополнения личной фонотеки, например) не получается. В таких случаях приходится еще долго прокручивать в памяти полюбившееся произведение и сожалеть о том, что ди-джей поскупился на слова и умолчал о том, кто же был автором композиции. Обычные поисковые машины в решении данной задачи не помогут, а вот специальные сервисы, по небольшому записанному отрывку песни определяющие ее название и исполнителя, вполне могут с ней справиться. Обзору таких необычных инструментов мы и посвятим данный материал.

Прежде чем перейти непосредственно к знакомству с героями сегодняшней статьи, позволим себе сделать небольшое лирическое отступление и вкратце рассказать о принципах работы рассматриваемых систем. В самом простом изложении техническая суть работы систем распознавания музыки сводится к использованию метода идентификации композиций с применением технологии акустических отпечатков, представляющих собой компактную цифровую последовательность, которая описывает характерные частотные составляющие звукового сигнала. Для каждой записи аудиоотпечаток уникален и может быть использован для определения треков, записанных с разным качеством, подвергнутых искажениям и преобразованиям. Эта особенность делает упомянутую методику крайне эффективной и обеспечивает высокий уровень распознавания.

Принцип распознавания песни таков: с записанного на скорую руку фрагмента неизвестной мелодии продолжительностью от 15 до 45 секунд снимается отпечаток, который затем отправляется в базу данных используемой системы, где происходит поиск совпадений с аудиоотпечатками уже опознанных композиций. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

Для оценки возможностей каждого рассматриваемого сервиса мы подготовили три тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из известной всем поклонникам группы The Beatles композиции Michelle, второй из песни Владимира Высоцкого "Кругом пятьсот" (альтернативное название - "Дорожная история") и третий из созданного по книге Эдуарда Успенского "Дядя Федор, Пес и Кот" мультипликационного фильма "Зима в Простоквашино" (помните строчки "А я все чаще замечаю, что меня как будто кто-то подменил"?). Для чистоты эксперимента все информационные теги, содержащиеся в проверочных композициях, были удалены, а сами файлы были переименованы в ни о чем не говорящие объекты с именами track1.mp3, track2.mp3 и track3.mp3.

AudioTag.info. Первый попавший в поле нашего зрения ресурс для распознавания музыки начал свою работу 6 марта 2009 года и умеет общаться с пользователем на русском и английском языках. Несмотря на молодость, проект может похвастаться не только внушительных размеров базой данных, хранящей сведения о более чем 1,3 млн музыкальных треках самых разных жанров, но и универсальным движком, распознающим файлы в форматах WAV, MP3, OGG, FLV, AMR, MP4 и многих других. Регистрации для работы с AudioTag.info не требуется: достаточно открыть браузер, загрузить фрагмент композиции (оптимальная продолжительность 15-45 секунд), ввести проверочный код, и робот, проанализировав доставшийся ему файл, постарается распознать его и выдать о нем подробную информацию. В нашем случае система безошибочно распознала все три отрывка тестовых композиций, что, конечно же, не может не радовать.

Shazam. Мобильный сервис, представляющий собой альтернативу присутствующему в телефонах Sony Ericsson инструментарию TrackID и реализованный с прицелом на широкий спектр портативных устройств, функционирующих на базе Windows Mobile, Symbian, Android, Apple iOS и BlackBerry. Клиентское приложение Shazam записывает отрывок (10-12 секунд) музыкального произведения с помощью встроенного микрофона телефона, формирует аудиоотпечаток и отсылает его на сервер, где он сравнивается с представленными в базе данных образцами треков. В случае успеха, на дисплее смартфона высвечивается информация о песне с обложкой соответствующего альбома и прочими полезными сведениями. Работает мобильная служба на удивление быстро и просто - от пользователя требуется только нажимать клавишу Tag Now и успевать анализировать поступающие от системы сообщения. С нашими тестовыми заданиями установленная на WM-девайс программа справилась на "четверку", оставив инкогнито только произведение Владимира Семеновича. Впрочем, вряд ли стоит записывать в недостатки Shazam отсутствие в базе данных одной из композиций Высоцкого, так как другую взятую для пробы песню отечественного барда заморский сервис распознал на "ура". Согласно предоставленным разработчиками сведениям, музыкальная база данных проекта насчитывает более восьми миллионов треков. Впечатляет.

Midomi. Сервис, предоставляющий любому посетителю сайта возможность вспомнить врезавшуюся в память композицию путем напевания или насвистывания оной в микрофон компьютера или мобильного устройства. Владельцам последних предоставлен также стандартный функционал, подразумевающий запись отрывка музыкального произведения с микрофона телефона и последующую отправку акустических отпечатков на сайт с базой данных аудиофайлов. Клиентские приложения Midomi доступны для портативных устройств под управлением ОС Windows Mobile, Symbian, Android и Apple iOS. Результат сканирования файлов упомянутым сервисом продемонстрировал англоязычную направленность службы, опознавшей только творение британской рок-группы из Ливерпуля. С творчеством отечественных исполнителей заморский музыкальный эксперт оказался не знаком.

Tunatic. Еще одно решение для идентификации музыки, выполненное в виде небольшой утилиты для операционных систем Windows и Mac OS X. Программа перехватывает звуковой поток с аудиокарты, производит анализ акустической информации в онлайновой базе данных и выдает вердикт о проигрываемой композиции. В случае обнаружения совпадения в БД, Tunatic отображает название песни и имя автора вместе со ссылкой на страницу, где указаны интернет-магазины, в которых можно приобрести полюбившееся произведение. Как показала практика, с определением композиций приложение справляется не ахти как, и разработчики продукта открыто предупреждают, что с классической музыкой к программе можно не обращаться. Знаменитую песню ансамбля "Битлз" утилита определила с ходу, а вот песню кота Матроскина в исполнении Олега Табакова и творчество Владимира Высоцкого не признала.

MusicBrainz. Открытая база данных, хранящая акустические отпечатки для самых разных музыкальных композиций, количество которых усилиями энтузиастов медленно, но верно приближается к планке в 10 миллионов треков. Будучи развиваемым на добровольных началах, проект предлагает пользователя внушительную коллекцию клиентских приложений для разных платформ, функциональная начинка которых позволяет работать не только с отдельными аудиофайлами, но и с целыми альбомами, наводя порядок в хранящихся на компьютере медиабиблиотеках. Потенциал MusicBrainz огромен, однако на практике выяснилось, что 30-секундных отрывков песен системе явно недостаточно для определения композиций, и что в ее познаниях русской музыки фигурируют обширные пробелы.

В случае если ни один из рассмотренных выше сервисов не помог в деле опознания неизвестной мелодии, на помощь может прийти музыкальная энциклопедия Musipedia, предлагающая несколько вариантов поиска песен: посредством напевания или насвистывания их в микрофон ПК, "настукивания" произведения с помощью клавиши "пробел", наигрывания мелодии на виртуальном фортепиано или введения кодов Парсонса. Естественно, качество поиска зависит от многих факторов, важнейшим из которых, по сути, является тривиальное наличие у пользователя чувства ритма и слуха. Кому понравилось стучать по клавиатуре и играть с компьютером в "Угадай мелодию", тому мы может порекомендовать сервис SongTapper и его отечественный аналог "Ритмотека". С одной стороны, работа с упомянутыми инструментами может напоминать забавный аттракцион, с другой - их использование может стать последней возможностью найти песню, мелодия которой никак не выходит из головы.

Если у кого-то из уважаемых читателей возникнет желание поделиться своими находками и опытом в данной области, таковых милости просим в наш форум. Не исключено, что совместными усилиями удастся собрать наиболее полную подборку способов определения авторства неизвестных мелодий.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Трафик YouTube в России обвалился ниже 20 % от нормы — Google отрицает свою вину 37 мин.
Не больше, а глубже: CD Projekt Red рассказала, каким будет открытый мир The Witcher 4 38 мин.
Telegram впервые стал прибыльным — с начала монетизации прошло три года 2 ч.
Чтобы сохранить Chrome, Google готова на серьёзные изменения в отношениях с Apple и другими партнёрами 2 ч.
Музыку для Heroes of Might & Magic: Olden Era напишет легендарный композитор «Героев Меча и Магии» 2 ч.
Nvidia устранила микрофризы в Indiana Jones and the Great Circle с помощью драйвера GeForce Hotfix 566.45 3 ч.
Регулятор «засветил» новую игру по «Терминатору» от издателя Terminator: Resistance 6 ч.
Трамп признался, что готов позволить TikTok «ещё немного» поработать в США 9 ч.
Fallout: London получит несколько DLC в 2025 году, а его авторы уже работают над оригинальной игрой на другом движке 22-12 18:11
Япония уличила Google в нарушении антимонопольного законодательства с помощью Chrome 22-12 15:17
Платы Asus на чипсетах AMD B840, AMD B850 и Intel B860 показались на изображениях 13 мин.
Xerox поглотит конкурирующего производителя принтеров Lexmark за $1,5 млрд 28 мин.
США запустили расследование зависимости от олдскульных китайских чипов 2 ч.
Gigabyte выпустит как минимум 19 плат на чипсетах AMD B850 и Intel B860 для новейших Ryzen и Core Ultra 2 ч.
Из-за внедрения СОРМ российские хостинг-провайдеры начнут 2025 год с повышения цен 2 ч.
Половину выручки от строительства дата-центров в России обеспечивает госсектор 3 ч.
В 2028 году на дата-центры США может прийтись уже 12 % энергопотребления всей страны 3 ч.
Европейский инвестиционный банк выделит Азербайджану €43 млн на строительство двух ЦОД AzInTelecom 4 ч.
Представлен роскошный флагманский смартфон Honor Magic7 RSR Porsche Design по цене от $1100 4 ч.
Nissan, Honda и Mitsubishi официально запустили переговоры о слиянии для борьбы с Tesla и BYD 5 ч.