我试图围绕这项任务,想知道是否有这样做的标准方式或某些库有用的方法。

在几个数据源S1 ... SN上跟踪和定时了某些事件。记录的信息是事件类型和时间戳。可能会顺序有几个相同类型的事件,也可能是间歇性的。可能会有“丢失”的事件 - 即当一个消息来源错过它时,当消息来源引入“误报”时,反之亦然。在不同来源对同一事件的观察之间通常存在时间差。由于来源的物理位置,该时间差具有恒定的组件,但也可能由网络延迟和其他因素引入不同的组件。

我需要找到一种算法,该算法可以找到最佳的最大时间间隔,该时间间隔应用于在单个“观察到的事件”中对所有来源的观测值进行分组,并允许检测缺失的事件和误报。

我想知道该解决方案是否真的在统计领域而不是algoritghms中。任何意见都将不胜感激。

有帮助吗?

解决方案

听起来您正在构建出勤系统:-)我目前正在构建的系统中也必须进行这种分组观察。就我而言,有一个员工的通行证,他们将把通行证者放在前面的通行证上进行注册。首先,该系统将从一名员工中选择所有出勤率。然后,它将将它们放在一天的盒子里,按注册时间订购。每次注册将评估是开始还是停止。如果第一次注册是开始注册,则系统将在12小时后最大程度地搜索停止注册。如果停止未来,则插入停止。已知计划时,可以实现额外的智能。 Perhapse您可以使用统计数据,但就我而言,这是一个算法的问题,结合了组织的知识。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top