无监督异常值检测

时间:2018-05-28 07:27:30

标签: python-3.x cluster-analysis curve-fitting outliers lmfit

我每行有6个点,并且有大约20k个这样的行。这些行点中的每一个实际上是曲线上的点,每行的曲线的性质是相同的(例如,S形曲线或直线等)。这6个点在每一行中可能有不同的x值。我也知道该曲线应该通过的每一行的一个点(a,b)。我应该如何找到可能异常的行或显示出比其他行更意外的行为?我正在考虑曲线拟合,但是每条曲线我只有6个点,我所知道的是大多数行具有相同的曲线性质,所以我可以为所有行制作一个通用曲线并且具有距离阈值异常值检测。

1 个答案:

答案 0 :(得分:0)

如果您只将6个点视为12维向量并运行任何常用的异常值检测方法(如LOF和LoOP)会发生什么?

看到12维向量上的欧几里德距离与6个点的6欧几里德距离之间的关系是微不足道的。所以这将比较这些曲线的相似之处。

您当然也可以为LOF定义复杂的距离函数。