我知道五种标准的无监督异常值检测方法:
但是隔离森林是什么类型?根据谷歌的说法,它是一个“基于树的模型”,但是否也可以说隔离森林是基于距离的模型?
答案 0 :(得分:1)
虽然 Anomaly detection's wikipedia page 声明它是一个 Density-based technique
,但您应该参考 the original paper 和 Scikit-learn 文档。
Isolation forest
对于异常检测确实很有用,对于大型数据集尤其有效。它由树结构表示,并且假定它使用 recursive partitioning
,
the number of splittings required to isolate a sample is equivalent to the path length from the root node to the terminating node.
除了 Scikit-learn docs 中提供的所有详细信息,您还可以在 source paper 中阅读:
<块引用>除了隔离与分析的主要区别外,iForest 在以下方面与现有的基于模型、基于距离和基于密度的方法不同:
<块引用>