Verizon SongID - Comment est-il programmé?
-
04-10-2019 - |
Question
Pour ceux qui ne connaissent pas bien le programme SongID de Verizon, il est téléchargeable application gratuite par le réseau VCast de Verizon. Il écoute une chanson pendant 10 secondes à tout moment au cours de la chanson et envoie ensuite ces données à une bête algorithmiques tout en sachant que la mâche vers le haut et vous renvoie tous les tags ID3 (artiste, album, chanson, etc ...)
Les deux premières parties et dernière partie sont simples, mais ce qui se passe au cours du traitement après le son enregistré est envoyé?
je figure, il doit prendre le fichier sonore (quel format?), L'analyser (comment? Avec quoi?) Pour certains identificateurs clés (ce sont ceux-ci? Attributs réguliers de fonctions d'onde? Phase / changement / amplitude / etc), et vérifiez contre une base de données.
Tout ce que je trouve en ligne sur la façon dont cela fonctionne est quelque chose de générique comme ce que je tapé ci-dessus.
Ce service est basé sur un sophistiqué reconnaissance audio algorithme combinant audio avancé la technologie d'empreintes digitales et un grand base de données de chansons. Lorsque vous téléchargez une fichier audio, il est en cours d'analyse par un moteur audio. Lors de l'analyse de son « Empreinte » audio est extrait et identifié en la comparant à la base de données de musique. À la fin de ce processus de reconnaissance, des informations des chansons sur leur correspondance avec les probabilités sont affichées à l'écran.
La solution
Tous ces services de travail en prenant une « empreinte digitale » à partir des données audio échantillonnées sur le côté client, l'envoyer à un serveur et en le comparant contre une base de données d'empreintes digitales.
L'un des développeurs de Shazam a écrit un très instructif papier blanc sur la façon dont la technologie fonctionne. Cela devrait vous donner toutes les informations dont vous avez besoin.