Verizon SongID - Как это запрограммировано?
-
04-10-2019 - |
Вопрос
Для тех, кто не знаком с программой POSTID Verizon, это бесплатное приложение, загружаемое через сеть Vaqu Verizon. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные для некоторых всех знаний алгоритмического зверя, который жует его вверх и отправляет вас назад все теги ID3 (артист, альбом, песня и т. Д.
Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?
Я полагаю, что он должен взять звуковой файл (какой формат?), Разбирайте его (как? С чем?) Для некоторых ключевых идентификаторов (что это? Регулярные атрибуты волновых функций? Фаза / сдвиг / амплитуда / и т. Д.) против базы данных.
Все, что я нахожу онлайн о том, как это работает что-то общее, как то, что я набрал выше.
Эта услуга основана на сложном алгоритме Audio Algorithm Algorith, сочетающих в себе расширенные технологии отпечатков пальцев звука и базу данных больших песен. Когда вы загружаете аудиофайл, он анализируется аудиовизором. Во время анализа его аудио «отпечаток пальца» извлекается и идентифицируется, сравнивая его с музыкальной базой данных. По завершении этого процесса распознавания информация о песнях с их вероятностью сопоставления отображается на экране.
Решение
Все эти услуги работают, принимая «отпечаток пальцев» из выборочных аудиоданных на стороне клиента, отправляя его на сервер и сравнивая его против базы данных отпечатков пальцев.
Один из разработчиков Шазам написал чрезвычайно информативное белая бумага На то, как работает технология. Это должно дать вам всю необходимую информацию.