Question

Je suis en train d'envelopper ma tête autour de cette tâche et je me demandais s'il y a un moyen standard de faire ceci ou certaines bibliothèques qui seraient utiles.

Certains événements sont suivis et chronométré à plusieurs sources de données S1 ... SN. Les informations enregistrées sont le type d'événement et l'horodatage. Il peut y avoir plusieurs événements du même type en séquence ou ils peuvent être intermittents. Il pourrait y avoir « manquantes » des événements - à savoir si l'une des sources misses, et, vice versa, lorsqu'une source introduit un « faux positif ». Il y a généralement une différence de temps entre les observations du même événement à différentes sources. Cette différence de temps a une composante constante en raison de l'emplacement physique des sources, mais il peut aussi avoir un composant introduit par la latence variant du réseau et d'autres facteurs.

Je dois trouver un algorithme qui trouverait l'intervalle de temps maximum optimal qui doit être utilisé pour regrouper les observations à toutes les sources dans un « événement observé » unique et permettre la détection des événements manquants et de faux positifs.

Je me demande si la solution est vraiment quelque part dans le domaine des statistiques plutôt que algoritghms. Toute entrée serait très apprécié.

Était-ce utile?

La solution

On dirait que vous construisez un système de présence :-) Dans le système que je suis en train de construire ce genre d'observations de regroupement est également nécessaire. Dans mon cas, il y a des employés qui ont un laissez-passer qu'ils vont mettre en avant en un passreader d'inscrire leur présence. Tout d'abord le système sélectionnera patientèle d'un employé. Ensuite, il les mettra dans des boîtes d'un jour, commandés par le temps d'enregistrement. Chaque inscription sera évaluée que ce soit une date de publication. Si le premier enregistrement est un enregistrement de démarrage, le système recherchera un enregistrement arrêt jusqu'à au maximum 12 heures plus tard. Si l'arrêt ne vient pas d'un arrêt est inséré. renseignements supplémentaires peuvent être mis en place lorsque la planification est connue. Perhapse vous pouvez utiliser les statistiques, mais dans mon cas, il était question d'algorithmes, combinée à la connaissance de l'organisation.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top