Domanda

Vorrei utilizzare DTS orditura per confrontare due vettori di feature per due registrazioni audio (ovviamente sto facendo tutto il pre-elaborazione necessaria prima). Il mio programma dovrebbe produrre la somiglianza tra i due registrazioni audio in percentuale. Per esempio 100% significa che le due registrazioni sono completamente identici, e più diverse sono le registrazioni, il numero più basso ottengo. Come faccio ad avere intorno ad esso? Il DTT mi dà solo la lunghezza del percorso o il costo della transizione e non so come convertire uno di questi numeri a un valore percentuale.

È stato utile?

Soluzione

Non sono a conoscenza di qualsiasi metrica distanza tra i segnali che viene misurato da cento. Se c'è un significato del 100%, quindi ci deve essere un senso dello 0%. Quindi prima bisogna chiedersi: cosa significa 0% media

Per DTW, sono abbastanza sicuro che non si stabilisce la conversione della distanza minima per "match per cento". Se è necessario, allora avete bisogno di definire una quantità euristica che è una funzione della distanza minima DTW.

EDIT: In realtà, si potrebbe sorta di definire una distanza più lunga, se si dispone di due registrazioni di lunghezza finita. Questa sarebbe la distanza di un percorso che è andato (se guardando la matrice costo) tutta la strada a destra e poi verso il basso, o fino in fondo e poi a destra. Il percorso migliore, vale a dire perfetta corrispondenza, scende la diagonale principale.

Una semplice idea: se si utilizza (0,1) (1,0) (1,1) come candidati passo, si potrebbe forse usare il numero di passi compiuti da (0,1) e (1,0) come una misura di cattiveria. Questa misura ha certamente un massimo ed un minimo, così allora potrebbe essere associato a un certo intervallo desiderabile come 0-100%.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top