是否有一种算法可以检测相对于数据集的奇数值

时间:2019-03-27 00:26:26

标签: algorithm machine-learning data-structures artificial-intelligence handler

我想开发一种算法,如果它检测到某些数字相对于另一个数字数组是奇数,并且每个数字都有一个日期,则该算法将执行操作。这些数字一天之中可能会有所不同,但是这些数字的变化率并不一定相关。

例如, 数据可以是

    [
      {number: 200, date: '12:00'},
      {number: 250, date: '12:02'},
      {number: 180, date: '12:04'},
      {number: 500, date: '12:06'}
    ]

我要测试的数组是

    [
      {number: 400, date: '12:08'},
      {number: 50, date: '12:10'}
    ]

我在指定的时间间隔内收集这些数据(以上间隔为两分钟) 我想检测数据是否随着时间的流逝而下降,但是由于其前后不一致,并且它可能会上升和下降,因此无法直接用以前的数据进行测量,但是我希望从长远来看。

我的问题是我应该采取什么方法?我是否需要为该任务训练模型?如果是这样,我应该采用哪种方法? 我当时正在考虑编写一些硬编码规则,这些规则可以测量平均值并将数据与阈值进行比较。但这对大量数据无效,因为我所说的不一致。

如果您有任何有用的资源可以帮助我,将非常感激。

P.S。以上数据不是真实的。

谢谢。

1 个答案:

答案 0 :(得分:0)

您想要一个离群值检测,仅在寻找减少量。

我建议创建一个内核,该内核根据最近的值预测下一个值。初学者请参见http://nbviewer.jupyter.org/github/SheffieldML/notebook/blob/master/GPy/basic_gp.ipynb。内核可以为您提供预测以及置信度。如果您的实际值比预测的允许置信裕度低一定距离,则可以将其称为负方向的离群值并对其做出反应:Diagram of a confidence margin