質問

私は2つのオーディオ録音(もちろん、私が最初にすべての必要な前処理をやっている)のための2つの特徴ベクトルを比較するために、動的時間伸縮を利用したいと思います。私のプログラムは、出力パーセントで2つのオーディオ録音の間の類似性をする必要があります。例えば、100%の2件の記録が完全に同一であることを意味し、そしてそれ以上の異なるレコーディング、Iが得るより少ない数です。どのように私はそれを周りに入手できますか? DTWは、私だけのパスの長さや移行のコストを与え、私はパーセント値にこれらの番号のいずれかを変換する方法を知りません。

役に立ちましたか?

解決

私は、パーセントで測定される信号の間のメトリックの任意の距離を認識していませんよ。 100%の意味がある場合、0%の意味がなければなりません。だから、最初に、あなたは自問する必要があります。?0%、平均

何をしますか

DTWのために、私はかなり確信していない「パーセント一致」に最小距離の変換が確立されていることです。あなたがする必要がある場合は、最小のDTW距離の関数であるヒューリスティック量を定義する必要があります。

EDIT:あなたは2つの有限長の録音を持っている場合、実際には、あなたはソートの最長の距離を定義することができます。それは右、その後のすべての方法ダウンダウン右クリック(コスト行列を見ている場合)、すべての道を行き、または経路の距離になります。最適なパス、すなわち完全に一致するが、主対角をダウンします。

一つのシンプルなアイデア:ステップ候補として(0,1)(1,0)(1,1)を使用している場合、あなたは多分(0,1)で撮影したステップ数を使用することができますし、(1,0)として、悪の尺度。この尺度は、確かにそうそれは0〜100%のようないくつかの望ましい範囲にマッピングすることができた。

、最大値と最小値を有します
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top