我想使用动态时间规整来比较两个特征向量两个音频记录(当然我首先做所有必要的预处理)。我的程序应该输出的百分比两个音频记录之间的相似性。例如100个%是指两个记录完全相同,并且多个不同的是录音,下数我得到。如何避开它?该DTW只给我路径的长度或转型的代价,我不知道如何将这些数字中的一个转换为百分比值。

有帮助吗?

解决方案

我不知道由百分比测量信号之间的任何距离度量的。如果有100%的意思,那么必须有0%的意思。所以,首先你需要问自己:什么呢0%的平均

有关DTW,我敢肯定,没有确定的最小距离转化为“匹配百分比”。如果必须,则需要定义是最小DTW距离的函数启发式量。

编辑:其实,可以排序的限定距离最长如果有两个有限长度的记录。这将是去(如果看成本矩阵)一路向右再向下一个路径的距离,或者一路下来,然后右键。的最佳路径,即完全匹配,下山主对角线。

一个简单的想法:如果使用(0,1)(1,0)(1,1)作为步骤的候选,可以使用可能的由(0,1)所采取的步骤(1,0)的数目和不良的量度。该措施肯定有最大和最小,所以那么它可以被映射到一些期望的范围等的0-100%。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top