Pregunta

Estoy tratando de envolver mi cabeza en torno a esta tarea y se preguntaba si hay una manera estándar de hacer esto o algunas bibliotecas que podrían ser útiles.

Algunos eventos se realiza un seguimiento y sincronizados en varias fuentes de datos S1 ... SN. La información registrada es el tipo de evento y la marca de tiempo. Puede haber varios eventos del mismo tipo secuencial o pueden ser intermitentes. Podría haber "faltantes" eventos - es decir, cuando una de las fuentes del área, y, viceversa, cuando una fuente introduce un "falso positivo". Normalmente hay una diferencia de tiempo entre las observaciones del mismo evento en diferentes fuentes. Esta diferencia de tiempo tiene una componente constante debido a la ubicación física de las fuentes, pero también puede tener un componente Varying introducido por latencia de la red y otros factores.

Necesito encontrar un algoritmo que encuentra el intervalo de tiempo óptimo máximo que se debe utilizar para agrupar las observaciones en todas las fuentes en un único "acontecimiento observado" y permitir la detección de los eventos que faltan y los falsos positivos.

Me pregunto si la solución es realmente en algún lugar en el campo de las estadísticas en lugar de algoritghms. Cualquier entrada sería muy apreciada.

¿Fue útil?

Solución

Parece que usted está construyendo un sistema de asistencia :-) En el sistema que estoy construyendo actualmente este tipo de observaciones agrupación también es necesaria. En mi caso no hay empleados que tienen un pase que van a poner delante de un passreader para registrar su asistencia. En primer lugar el sistema seleccionará todas las asistencias de un empleado. A continuación, los pondrá en cajas de un día, ordenados por el tiempo de registro. Cada registro se evaluará si se trata de un arranque o parada. Si el primer registro es un registro de inicio, a continuación, el sistema buscará un registro de parada hasta como máximo 12 horas después. Si se inserta la parada no viene una parada. inteligencia adicional se puede poner en su lugar cuando se conoce la planificación. Perhapse podría utilizar las estadísticas, pero en mi caso se trataba de una cuestión de algoritmos, combinado con el conocimiento de la organización.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top