Pregunta

Me gustaría usar programación dinámica para comparar dos vectores de características para dos grabaciones de audio (por supuesto que estoy haciendo todo el procesamiento previo necesario en primer lugar). Mi programa debe ser la salida de la similitud entre las dos grabaciones de audio en por ciento. Por ejemplo 100 medios% que las dos grabaciones son completamente idénticos, y cuanto más diferentes son las grabaciones, el número más bajo que consigo. ¿Cómo llego a hacerlo? El DTW sólo me da la longitud de la ruta o el costo de la transición y no sé cómo convertir uno de estos números a un valor porcentual.

¿Fue útil?

Solución

No estoy al tanto de cualquier métrica distancia entre señales que se mide por ciento. Si hay un significado más del 100%, entonces tiene que haber un sentido de 0%. Así que primero hay que preguntarse: ¿qué hace el 0% media

Para DTW, estoy bastante seguro de que no hay se establece la conversión de la distancia mínima para "partido por ciento". Si es necesario, a continuación, es necesario definir una cantidad heurístico que es una función de la distancia mínima DTW.

EDIT: En realidad, se podría definir una especie de distancia más larga si tiene dos grabaciones de longitud finita. Esa sería la distancia de un camino que se fue (si mirar la matriz de costos) todo el camino a la derecha y luego hacia abajo, o todo el camino hasta luego a la derecha. El mejor camino, es decir, la pareja perfecta, se cae la diagonal principal.

Una idea simple: si se utiliza (0,1) (1,0) (1,1) como candidatos paso, se podría utilizar quizá el número de pasos dados por (0,1) y (1,0) como una medida de la maldad. Esta medida tiene ciertamente un máximo y un mínimo, por lo que entonces podría ser mapeada a algún intervalo deseable como 0-100%.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top