質問

2 つの条件下でのさまざまなイベントの頻度データがあり、結果として頻度 F1 と F2 のセットが得られます。条件 1 のイベントの頻度を条件 2 の頻度で正規化したいと思います。ただし、条件 1 では発生するが条件 2 では発生しないイベントがあり、正規化しようとするとゼロ除算の問題が発生します。

raw カウント データについては、多数の平滑化手法があることを理解しています (例:Witten-Bell) はこれを解決するのに役立ちますが、私が知っているのは周波数だけであり、個々のカウントはありません。言い換えれば、{0, 0.1, 0.2, 0.7} のような周波数があり、これは {0, 1, 2, 7}、{0, 10, 20, 70} などのカウントに対応する可能性があります。この種の周波数データを平滑化できるアルゴリズムはありますか?

役に立ちましたか?

解決

はい。$\:$ カウントの合計が頻度データを生成する最小値であると仮定します。$\:$ (その方法は、周波数が double として計算および保存されたか、あるいはそれ以外のものとして保存されたかによって異なります。)

ライセンス: CC-BY-SA帰属
所属していません cs.stackexchange
scroll top