Pregunta

Para cualquier persona que no están familiarizados con el programa SongID de Verizon, que es una aplicación que puede descargarse gratuitamente a través de la red de Verizon VCast. Se escucha una canción durante 10 segundos en cualquier momento durante la canción y luego envía estos datos a una bestia algorítmica que todo lo sabe que mastica para arriba y le envía una copia de todos los ID3 tags (artista, álbum, canción, etc ...)

Las dos primeras partes y última parte son sencillos, pero lo que sucede durante el procesamiento después de que se envía el sonido grabado?

Me imagino que debe tener el archivo de sonido (qué formato?), Analizarlo (¿cómo? ¿Con qué?) Para algunos identificadores de clave (¿Qué es esto? Atributos regulares de funciones de onda? De fase / cambio / amplitud / etc), y compararla con una base de datos.

Todo lo que encontrará en línea acerca de cómo funciona esto es algo genérico como lo que he escrito anteriormente.

audiotag.info

Este servicio se basa en una reconocimiento de audio sofisticado algoritmo que combina audio avanzado las huellas digitales de la tecnología y una gran base de datos de canciones. Al cargar una archivo de audio, que está siendo analizado por una Motor de audio. Durante el análisis de su audio “huella digital” se extrae y se identificado por compararlo con el base de datos musical. A la finalización de este proceso de reconocimiento, la información canciones sobre con su juego probabilidades se muestran en la pantalla.

¿Fue útil?

Solución

Todos estos servicios funcionan mediante la adopción de una "huella digital" de los datos de audio muestreados en el lado del cliente, enviarlo a un servidor y comparándola con una base de datos de huellas dactilares.

Uno de los desarrolladores de Shazam ha escrito un muy informativo blanco documento sobre cómo funciona la tecnología. Esto debe darle toda la información que necesita.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top