Сегодня 03 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Угадай мелодию, или Системы идентификации музыкальных композиций

Любителей слушать музыку несть числа. Для одних меломанов она является источником вдохновения и играет важную роль в жизни, другим она позволяет расслабиться и собраться с мыслями, а третьим - увидеть в ней отражение собственных эмоций и переживаний. Немало находится и тех, для кого данный вид искусства является лишь средством развлечения, скрашивающим суровые будни и заставляющим изредка ломать голову над идентификацией той или иной композиции, доносящейся из колонок или наушников. Да что говорить, наверняка, каждый из читателей 3DNews хоть раз да сталкивался с ситуацией, когда по радио звучит красивая мелодия, а вспомнить ее название и исполнителя (для последующего пополнения личной фонотеки, например) не получается. В таких случаях приходится еще долго прокручивать в памяти полюбившееся произведение и сожалеть о том, что ди-джей поскупился на слова и умолчал о том, кто же был автором композиции. Обычные поисковые машины в решении данной задачи не помогут, а вот специальные сервисы, по небольшому записанному отрывку песни определяющие ее название и исполнителя, вполне могут с ней справиться. Обзору таких необычных инструментов мы и посвятим данный материал.

Прежде чем перейти непосредственно к знакомству с героями сегодняшней статьи, позволим себе сделать небольшое лирическое отступление и вкратце рассказать о принципах работы рассматриваемых систем. В самом простом изложении техническая суть работы систем распознавания музыки сводится к использованию метода идентификации композиций с применением технологии акустических отпечатков, представляющих собой компактную цифровую последовательность, которая описывает характерные частотные составляющие звукового сигнала. Для каждой записи аудиоотпечаток уникален и может быть использован для определения треков, записанных с разным качеством, подвергнутых искажениям и преобразованиям. Эта особенность делает упомянутую методику крайне эффективной и обеспечивает высокий уровень распознавания.

Принцип распознавания песни таков: с записанного на скорую руку фрагмента неизвестной мелодии продолжительностью от 15 до 45 секунд снимается отпечаток, который затем отправляется в базу данных используемой системы, где происходит поиск совпадений с аудиоотпечатками уже опознанных композиций. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

Для оценки возможностей каждого рассматриваемого сервиса мы подготовили три тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из известной всем поклонникам группы The Beatles композиции Michelle, второй из песни Владимира Высоцкого "Кругом пятьсот" (альтернативное название - "Дорожная история") и третий из созданного по книге Эдуарда Успенского "Дядя Федор, Пес и Кот" мультипликационного фильма "Зима в Простоквашино" (помните строчки "А я все чаще замечаю, что меня как будто кто-то подменил"?). Для чистоты эксперимента все информационные теги, содержащиеся в проверочных композициях, были удалены, а сами файлы были переименованы в ни о чем не говорящие объекты с именами track1.mp3, track2.mp3 и track3.mp3.

AudioTag.info. Первый попавший в поле нашего зрения ресурс для распознавания музыки начал свою работу 6 марта 2009 года и умеет общаться с пользователем на русском и английском языках. Несмотря на молодость, проект может похвастаться не только внушительных размеров базой данных, хранящей сведения о более чем 1,3 млн музыкальных треках самых разных жанров, но и универсальным движком, распознающим файлы в форматах WAV, MP3, OGG, FLV, AMR, MP4 и многих других. Регистрации для работы с AudioTag.info не требуется: достаточно открыть браузер, загрузить фрагмент композиции (оптимальная продолжительность 15-45 секунд), ввести проверочный код, и робот, проанализировав доставшийся ему файл, постарается распознать его и выдать о нем подробную информацию. В нашем случае система безошибочно распознала все три отрывка тестовых композиций, что, конечно же, не может не радовать.

Shazam. Мобильный сервис, представляющий собой альтернативу присутствующему в телефонах Sony Ericsson инструментарию TrackID и реализованный с прицелом на широкий спектр портативных устройств, функционирующих на базе Windows Mobile, Symbian, Android, Apple iOS и BlackBerry. Клиентское приложение Shazam записывает отрывок (10-12 секунд) музыкального произведения с помощью встроенного микрофона телефона, формирует аудиоотпечаток и отсылает его на сервер, где он сравнивается с представленными в базе данных образцами треков. В случае успеха, на дисплее смартфона высвечивается информация о песне с обложкой соответствующего альбома и прочими полезными сведениями. Работает мобильная служба на удивление быстро и просто - от пользователя требуется только нажимать клавишу Tag Now и успевать анализировать поступающие от системы сообщения. С нашими тестовыми заданиями установленная на WM-девайс программа справилась на "четверку", оставив инкогнито только произведение Владимира Семеновича. Впрочем, вряд ли стоит записывать в недостатки Shazam отсутствие в базе данных одной из композиций Высоцкого, так как другую взятую для пробы песню отечественного барда заморский сервис распознал на "ура". Согласно предоставленным разработчиками сведениям, музыкальная база данных проекта насчитывает более восьми миллионов треков. Впечатляет.

Midomi. Сервис, предоставляющий любому посетителю сайта возможность вспомнить врезавшуюся в память композицию путем напевания или насвистывания оной в микрофон компьютера или мобильного устройства. Владельцам последних предоставлен также стандартный функционал, подразумевающий запись отрывка музыкального произведения с микрофона телефона и последующую отправку акустических отпечатков на сайт с базой данных аудиофайлов. Клиентские приложения Midomi доступны для портативных устройств под управлением ОС Windows Mobile, Symbian, Android и Apple iOS. Результат сканирования файлов упомянутым сервисом продемонстрировал англоязычную направленность службы, опознавшей только творение британской рок-группы из Ливерпуля. С творчеством отечественных исполнителей заморский музыкальный эксперт оказался не знаком.

Tunatic. Еще одно решение для идентификации музыки, выполненное в виде небольшой утилиты для операционных систем Windows и Mac OS X. Программа перехватывает звуковой поток с аудиокарты, производит анализ акустической информации в онлайновой базе данных и выдает вердикт о проигрываемой композиции. В случае обнаружения совпадения в БД, Tunatic отображает название песни и имя автора вместе со ссылкой на страницу, где указаны интернет-магазины, в которых можно приобрести полюбившееся произведение. Как показала практика, с определением композиций приложение справляется не ахти как, и разработчики продукта открыто предупреждают, что с классической музыкой к программе можно не обращаться. Знаменитую песню ансамбля "Битлз" утилита определила с ходу, а вот песню кота Матроскина в исполнении Олега Табакова и творчество Владимира Высоцкого не признала.

MusicBrainz. Открытая база данных, хранящая акустические отпечатки для самых разных музыкальных композиций, количество которых усилиями энтузиастов медленно, но верно приближается к планке в 10 миллионов треков. Будучи развиваемым на добровольных началах, проект предлагает пользователя внушительную коллекцию клиентских приложений для разных платформ, функциональная начинка которых позволяет работать не только с отдельными аудиофайлами, но и с целыми альбомами, наводя порядок в хранящихся на компьютере медиабиблиотеках. Потенциал MusicBrainz огромен, однако на практике выяснилось, что 30-секундных отрывков песен системе явно недостаточно для определения композиций, и что в ее познаниях русской музыки фигурируют обширные пробелы.

В случае если ни один из рассмотренных выше сервисов не помог в деле опознания неизвестной мелодии, на помощь может прийти музыкальная энциклопедия Musipedia, предлагающая несколько вариантов поиска песен: посредством напевания или насвистывания их в микрофон ПК, "настукивания" произведения с помощью клавиши "пробел", наигрывания мелодии на виртуальном фортепиано или введения кодов Парсонса. Естественно, качество поиска зависит от многих факторов, важнейшим из которых, по сути, является тривиальное наличие у пользователя чувства ритма и слуха. Кому понравилось стучать по клавиатуре и играть с компьютером в "Угадай мелодию", тому мы может порекомендовать сервис SongTapper и его отечественный аналог "Ритмотека". С одной стороны, работа с упомянутыми инструментами может напоминать забавный аттракцион, с другой - их использование может стать последней возможностью найти песню, мелодия которой никак не выходит из головы.

Если у кого-то из уважаемых читателей возникнет желание поделиться своими находками и опытом в данной области, таковых милости просим в наш форум. Не исключено, что совместными усилиями удастся собрать наиболее полную подборку способов определения авторства неизвестных мелодий.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
«Наслаждайтесь последними днями покоя»: перезапуск Painkiller не выйдет 9 октября 31 мин.
Акции Google резко подорожали после того, как компания увернулась от принудительной продажи Chrome 2 ч.
«С возвращением, Crazy Taxi»: стартовавший в раннем доступе симулятор CyberTaxi: Lunatic Nights напомнил игрокам о легендарной серии аркад 4 ч.
Легендарный шутер Quake III Arena стал доступен в браузерах — бесплатно, без регистраций, смс и рекламы 4 ч.
Россиянам перекроют доступ к Spotify Premium — сервис ужесточает правила 4 ч.
Импортозамещение продолжает оставаться основным драйвером IT-расходов в российских компаниях 4 ч.
ЕС продолжит строго регулировать технологическую отрасль, несмотря на угрозы Трампа 8 ч.
Cloudflare отразила самую мощную в истории DDoS-атаку — 11,5 Тбит/с в пике 8 ч.
SAP инвестирует более €20 млрд в суверенное облако для поддержки европейских клиентов 8 ч.
Инсайдер: амбициозная Resident Evil Requiem выйдет на Nintendo Switch 2 и даже PS4 8 ч.
Acer показала первый ноутбук на Intel Panther Lake — Swift 16 AI с гигантским тачпадом 2 ч.
Garmin представила смарт-часы Fenix 8 Pro с поддержкой сотовой и спутниковой связи, но есть нюанс 2 ч.
Прототип орбитального ЦОД Axiom Space и Red Hat для экспериментов с периферийными вычислениями прибыл на МКС 3 ч.
TSMC отвергла слухи, что Дженсен Хуанг пытался на неё надавить от имени Трампа 4 ч.
«К2 НейроТех» представил ПАК-AI 2.0 с увеличенной на 30 % производительностью 4 ч.
Acer представила OLED-монитор Predator X27U F8 с частотой до 720 Гц и мощный ноутбук Predator Helios 18P AI с RTX 5090 4 ч.
LG Display получила сертификат Perfect Reproduction для OLED-панелей четвёртого поколения 4 ч.
Acer представила новые геймерские мониторы Nitro — до 40 дюймов, до 5K и до 360 Гц 5 ч.
GlobalFoundries объявила о готовности к массовому развёртыванию решений в сфере кремниевой фотоники 5 ч.
Acer представила настольный ИИ-суперкомпьютер Veriton GN100 за $3999 на основе Nvidia GB10 Blackwell 6 ч.