Вопрос

Для тех, кто не знаком с программой POSTID Verizon, это бесплатное приложение, загружаемое через сеть Vaqu Verizon. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные для некоторых всех знаний алгоритмического зверя, который жует его вверх и отправляет вас назад все теги ID3 (артист, альбом, песня и т. Д.

Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?

Я полагаю, что он должен взять звуковой файл (какой формат?), Разбирайте его (как? С чем?) Для некоторых ключевых идентификаторов (что это? Регулярные атрибуты волновых функций? Фаза / сдвиг / амплитуда / и т. Д.) против базы данных.

Все, что я нахожу онлайн о том, как это работает что-то общее, как то, что я набрал выше.

От Audiotag.info.

Эта услуга основана на сложном алгоритме Audio Algorithm Algorith, сочетающих в себе расширенные технологии отпечатков пальцев звука и базу данных больших песен. Когда вы загружаете аудиофайл, он анализируется аудиовизором. Во время анализа его аудио «отпечаток пальца» извлекается и идентифицируется, сравнивая его с музыкальной базой данных. По завершении этого процесса распознавания информация о песнях с их вероятностью сопоставления отображается на экране.

Это было полезно?

Решение

Все эти услуги работают, принимая «отпечаток пальцев» из выборочных аудиоданных на стороне клиента, отправляя его на сервер и сравнивая его против базы данных отпечатков пальцев.

Один из разработчиков Шазам написал чрезвычайно информативное белая бумага На то, как работает технология. Это должно дать вам всю необходимую информацию.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top