ELKI聚类FDBSCAN算法

时间:2016-12-10 21:39:23

标签: cluster-analysis dbscan elki

请您在ELKI向我展示FDBSCAN输入文件的示例。我得到这样的错误:

Task failed
de.lmu.ifi.dbs.elki.data.type.NoSupportedDataTypeException: No data type found satisfying: UncertainObject,field
Available types: DBID DoubleVector,dim=2
    at de.lmu.ifi.dbs.elki.database.AbstractDatabase.getRelation(AbstractDatabase.java:126)
    at de.lmu.ifi.dbs.elki.algorithm.clustering.uncertain.FDBSCANNeighborPredicate.instantiate(FDBSCANNeighborPredicate.java:131)
    at de.lmu.ifi.dbs.elki.algorithm.clustering.gdbscan.GeneralizedDBSCAN.run(GeneralizedDBSCAN.java:122)
    at de.lmu.ifi.dbs.elki.algorithm.clustering.gdbscan.GeneralizedDBSCAN.run(GeneralizedDBSCAN.java:79)
    at de.lmu.ifi.dbs.elki.workflow.AlgorithmStep.runAlgorithms(AlgorithmStep.java:105)
    at de.lmu.ifi.dbs.elki.KDDTask.run(KDDTask.java:112)
    at de.lmu.ifi.dbs.elki.application.KDDCLIApplication.run(KDDCLIApplication.java:61)
    at [...]

1 个答案:

答案 0 :(得分:1)

FDBSCAN需要UncertainObject类型的数据,即具有不确定性信息的对象。

如果您只是加载CSV文件,数据将某些,并且您无法使用不确定的群集。

有几种不确定性建模方法。这些在typeconversions包中实现过滤器

  • UncertainSplitFilter可以将长度为k * N的向量分成k个可能的实例,每个实例的长度为N,权重均匀。
  • WeightedUncertainSplitFilter类似,但每个实例也可以关联一个权重。
  • UncertainifyFilter可以通过以下方式模拟不确定性假设原始矢量周围有高斯或均匀分布。
    • UniformUncertainifier(U-Model,见UniformContinuousUncertainObject的Javadoc)
    • SimpleGaussianUncertainifier(请参阅SimpleGaussianContinuousUncertainObject的Javadoc)
    • UnweightedDiscreteUncertainifier(BID模型,请参阅WeightedDiscreteUncertainObject的Javadoc)
    • WeightedDiscreteUncertainifier(如上所述)
  • 或通过扩展API添加您自己的不确定性信息!