Domanda

Ho dati di frequenza per diversi eventi sotto due condizioni, con conseguente gruppi di frequenze F1 e F2. Vorrei normalizzare le frequenze degli eventi sotto condizione 1 dai loro frequenze nella circostanza 2. Tuttavia, ci sono eventi che si verificano in condizione 1 ma non condizione 2, con conseguenti problemi di divisione per zero quando si tenta di normalizzare.

Per i dati di conteggio prime, ho capito che ci sono una serie di tecniche di smoothing (ad esempio Witten-Bell) che possono aiutare a risolvere la questione, ma ho solo le frequenze, non i singoli conta. In altre parole, ho frequenze come {0, 0,1, 0,2, 0,7} che potrebbe corrispondere a conti di {0, 1, 2, 7}, {0, 10, 20, 70}, ecc Ci sono eventuali algoritmi sono in grado di regolare questo tipo di dati di frequenza?

È stato utile?

Soluzione

Sì. $ \: $ Supponiamo che i conteggi hanno la somma più piccola che produrrebbe i vostri dati di frequenza. $ \: $ (. Come farlo dipende dal fatto che le frequenze sono stati calcolati e memorizzati come doppie o qualcos'altro)

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a cs.stackexchange
scroll top