我正在使用sklearn的接口来评估dbscan的结果,根据文档,F-measure是一个分类指标,但dbscan是一种聚类方法。我知道F-measure可以作为理论上聚类的外部评估方法。那么我如何利用它来评估dbscan的结果呢?
答案 0 :(得分:0)
根据您定义精确度和召回的方式,有多个f度量。因为F只是精度和召回的几何平均值。
如果您使用ELKI,它会自动为您计算。
但问题是当聚类算法产生噪声时精确度和召回的定义(如DBSCAN那样)。噪音不是一个集群。但那又是什么呢?您如何评估噪音质量?你如何同时评估集群和噪声?
遗憾的是,许多聚类评估措施无法处理噪音。我不知道一个真正令人信服的措施。噪音处理。