我正在监测每一秒的单个统计量,其值在0和1之间。这些个体可能偶尔会执行一些强烈的活动,这反映在该统计数据的行为中(通过在短时间内快速振荡,例子)。
我想使用统计信息来检测此活动是否存在。
因此,我的训练集由长长的数值流组成,并且在某些突出的时间间隔内进行激烈的活动。例如,我的一个流可能如下所示:
... 0.1 0.2 0.2 0.3 0.4 0.4 0.4 0.7 0.1 0.6 0.2 0.9 0.8 0.7 0.7 0.7 0.6 ...
(强烈活动的时期强调在 粗体斜体 )
通过基本机器学习算法的一些基本知识,我可以想到几种尝试解决这个问题的方法。其中之一就是让我的训练集具有相同大小的值串并使用逻辑回归来检测它们是否包含一段激烈的活动。然而,这样做的缺点是我必须事先确定这个长度,并且训练值可能只包含一段激烈活动的时间段。
有没有一种标准方法可以将其作为机器学习问题来处理?
答案 0 :(得分:0)
你可以简单地转换 a1 a2 a3 ... streem into a2-a1 a3-a2 a4-a3 .... an - an-1 stream(两个后续值之间的差异)
如果某个值超过阈值0.5,则会出现加息或跌倒(异常)。
这可以解决大多数情况,但不会解决逐渐增加和减少的问题。
如果你想要这个学术术语,它在“时态数据”或“流”中被称为“异常值检测”。您可以在Microsoft here
中找到方法调查