Вопрос

Я пытаюсь обернуть голову вокруг этой задачи и задаваться вопросом, есть ли стандартный способ выполнения этого или некоторых библиотек, которые были бы полезны.

Некоторые события отслеживаются и приурочены в нескольких источниках данных S1 ... Sn. Записанная информация является типом события и метки времени. Может быть несколько событий одного и того же типа последовательно, или они могут быть прерывистыми. Могут быть «отсутствуют» события - то есть, когда один из источников пропускает его, и, наоборот, когда источник вводит «ложное положительное». Как правило, существует разница во времени между наблюдениями того же события в разных источниках. На этой разницу времени имеет постоянный компонент из-за физического расположения источников, но также может иметь различный компонент, представленный сетевой задержкой и другими факторами.

Мне нужно найти алгоритм, который найдет оптимальный максимальный интервал времени, который должен использоваться для группировки наблюдений во всех источниках в одном «наблюдаемом событии» и разрешать обнаружение недостающих событий и ложных срабатываний.

Мне интересно, если решение действительно где-то в поле статистики, а не в алгоритхмах. Любой вклад будет высоко оценен.

Это было полезно?

Решение

Похоже, вы создаете систему посещаемости :-) В системе я строю в настоящее время, такого рода группирующих наблюдений также необходимо. В моем случае есть сотрудники, которые имеют пропуск, что они поставит Passreader, чтобы зарегистрировать их посещаемость. Сначала система выберет все посещаемость от одного сотрудника. Тогда он поставит их в коробки одного дня, приказал во время регистрации. Каждая регистрация будет оценена на том, стоит ли это начало или остановка. Если первая регистрация - это начать регистрацию, то система будет искать остановку регистрации до максимально 12 часов. Если остановка не приходит, остановка вставлена. Дополнительный интеллект может быть установлен на место, когда планирование известно. Pergapse Вы можете использовать статистику, но в моем случае это был вопрос алгоритмов, в сочетании со знанием организации.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top