Frecuencias de suavizado sin datos de conteo

https://cs.stackexchange.com/questions/7821

16-10-2019
|

Pregunta

Tengo datos de frecuencia para diferentes eventos en dos condiciones, lo que resulta en conjuntos de frecuencias F1 y F2. Me gustaría normalizar las frecuencias de los eventos bajo la condición 1 por sus frecuencias bajo la condición 2. Sin embargo, hay eventos que ocurren en la condición 1 pero no en la condición 2, lo que resulta en problemas divididos por cero cuando intento normalizar.

Para los datos de conteo sin procesar, entiendo que hay una serie de técnicas de suavizado (por ejemplo, Witten-Bell) que pueden ayudar a resolver esto, pero solo tengo las frecuencias, no los recuentos individuales. En otras palabras, tengo frecuencias como {0, 0.1, 0.2, 0.7} que podrían corresponder a los recuentos de {0, 1, 2, 7}, {0, 10, 20, 70}, etc. ¿Hay algoritmos que ¿Son capaces de suavizar este tipo de datos de frecuencia?

Solución

Sí. $ : $ Suponga que los recuentos tienen la suma más pequeña que produciría sus datos de frecuencia. $ : $ (Cómo hacerlo depende de si las frecuencias se calcularon y almacenaron como dobles o algo más).

Licenciado bajo: CC-BY-SA con atribución

No afiliado a cs.stackexchange