Domanda

Sto cercando di avvolgere la mia testa intorno a questo compito e si chiede se c'è un modo standard di fare questo o alcune librerie che sarebbe utile.

Alcuni eventi sono monitorati e cronometrati in diverse fonti di dati S1 ... SN. Le informazioni registrate è il tipo di evento e timestamp. Ci possono essere diversi eventi dello stesso tipo in modo sequenziale oppure può essere intermittente. Ci potrebbe essere eventi "dispersi" - cioè quando una delle fonti manca, e, viceversa, quando una sorgente introduce un "falso positivo". V'è in genere una differenza di tempo tra le osservazioni dello stesso evento a fonti diverse. Questa differenza di tempo ha una componente costante a causa della posizione fisica della fonte, ma può anche avere una componente variare introdotto dalla latenza di rete e di altri fattori.

Ho bisogno di trovare un algoritmo che avrebbe trovato l'intervallo di tempo ottimale di massima che dovrebbe essere utilizzato per raggruppare le osservazioni a tutte le fonti in un unico "evento osservato" e consentire il rilevamento degli eventi mancanti e falsi positivi.

Mi chiedo se la soluzione è davvero da qualche parte nel campo delle statistiche piuttosto che algoritghms. Qualsiasi input sarebbe molto apprezzato.

È stato utile?

Soluzione

Sembra che si sta costruendo un sistema di presenza :-) Nel sistema attualmente sto costruendo questo tipo di osservazioni di raggruppamento è anche necessario. Nel mio caso c'è dipendenti che hanno un pass che metteranno di fronte fuori un passreader per registrare la loro presenza. In primo luogo il sistema selezionerà tutte le presenze da un dipendente. Poi li metterà in scatole di un giorno, in ordine di tempo di registrazione. Ogni registrazione sarà valutato che si tratti di un inizio o di arresto. Se la prima registrazione è una registrazione di avvio, il sistema cercherà una registrazione di arresto fino ad un massimo di 12 ore più tardi. Se viene inserita la fermata non arriva uno stop. l'intelligenza supplementare può essere messo in posizione quando la pianificazione è noto. Perhapse è possibile utilizzare le statistiche, ma nel mio caso si trattava di una questione di algoritmi, combinata con la conoscenza dell'organizzazione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top