weka DBSCAN集群,如何获得核心点

时间:2015-09-23 20:35:11

标签: cluster-analysis data-mining dbscan

我正在使用DBSCAN来聚类数据,在集群之后,对于每个我想获取核心点的数据属性值的集群,有没有办法做到这一点?

 private static void ClusteringDemo(String filename) throws Exception {
    ClusterEvaluation eval;
    Instances  data;
    DBSCAN cl;
    data = DataSource.read(filename);

    // manual call
    cl  = new DBSCAN();
    cl.setMinPoints(6);
    cl.setEpsilon(0.05);
    cl.buildClusterer(data);
    eval = new ClusterEvaluation();
    eval.setClusterer(cl);
    eval.evaluateClusterer(new Instances(data));
    System.out.println(eval.clusterResultsToString());

    //setup visualization
    PlotData2D predData = ClustererPanel.setUpVisualizableInstances(data, eval);
    VisualizePanel vp = new VisualizePanel();
    vp.addPlot(predData);

    // display data
    JFrame jf = new JFrame("Weka Clusterer Visualize: " + vp.getName());
    jf.setDefaultCloseOperation(JFrame.DISPOSE_ON_CLOSE);
    jf.setSize(500, 400);
    jf.getContentPane().setLayout(new BorderLayout());
    jf.getContentPane().add(vp, BorderLayout.CENTER);
    jf.setVisible(true);
}

cl是DBSCAN类,我只实现了可视化。任何人都可以教我如何获得核心点值?

1 个答案:

答案 0 :(得分:0)

没有"核心点值"。

DBSCAN 使用像k-mean那样的集群中心。

Consider this DBSCAN image (Wikipedia)。 "核心点值"红色集群是?

群集可以是任意形状的,然后没有"中心"。事实上,所有点的平均值可能在集群之外。

群集至少有一个核心点,但可能还有更多核心点 - 所有这些核心点可能同时成为核心点。因此,指向核心点的信息不是很重要。如果我没记错的话,ELKI可以选择公开这些信息,但默认情况下会立即丢弃。