在两个条件下,我有针对不同事件的频率数据,从而导致频率F1和F2。我想通过条件2下的频率在条件1下的事件频率标准化。但是,有些事件发生在条件1中,但没有条件2,当我试图归一化时会导致划分为零的问题。

对于原始计数数据,我知道有许多平滑技术(例如Witten-Bell)可以帮助解决这个问题,但是我只有频率,而不是个人计数。换句话说,我的频率是{0、0.1、0.2、0.7},可能对应于{0、1、2、7},{0、10、20、70}等的计数。能够平滑这种类型的频率数据吗?

有帮助吗?

解决方案

是的。 $ :$假设计数具有产生您的频率数据的最小总和。 $ :$(如何做到这取决于是否计算出频率并将其存储为双打还是其他。)

许可以下: CC-BY-SA归因
不隶属于 cs.stackexchange
scroll top