我正试图绕过这个任务,想知道是否有一种标准的方法来做这个或一些有用的库。
在几个数据源S1 ... SN处跟踪和定时某些事件。记录的信息是事件类型和时间戳。顺序可能存在多个相同类型的事件,或者它们可能是间歇性的。可能存在“缺失”事件 - 即,当其中一个来源错过它时,反之亦然,当源引入“误报”时。在不同来源的同一事件的观察之间通常存在时间差。由于源的物理位置,该时间差具有恒定的分量,但也可能由网络延迟和其他因素引入变化的分量。
我需要找到一种算法,该算法可以找到应该用于在单个“观察事件”中对所有来源的观察进行分组的最佳最大时间间隔,并允许检测缺失事件和误报。
我想知道解决方案是否真的在统计字段中的某个地方而不是algoritghms。任何意见都会非常感激。
答案 0 :(得分:1)
听起来你正在建立一个考勤系统:-)在我正在建设的系统中,这种分组观察也是必要的。在我的情况下,有一个员工有一个通行证,他们将放在一个通过读取器前面注册他们的出勤。首先,系统将选择一名员工的所有出勤率。然后它将把它们放在一天的盒子里,按照登记时间排序。每个注册都将评估是开始还是停止。如果第一次注册是开始注册,则系统将在最多12小时后搜索停止注册。如果没有停止,则插入停止。在规划已知时,可以实施额外的情报。你可以使用统计数据,但在我的情况下,这是一个算法问题,结合组织的知识。