我正在使用DBSCAN来聚类数据,在集群之后,对于每个我想获取核心点的数据属性值的集群,有没有办法做到这一点?
private static void ClusteringDemo(String filename) throws Exception {
ClusterEvaluation eval;
Instances data;
DBSCAN cl;
data = DataSource.read(filename);
// manual call
cl = new DBSCAN();
cl.setMinPoints(6);
cl.setEpsilon(0.05);
cl.buildClusterer(data);
eval = new ClusterEvaluation();
eval.setClusterer(cl);
eval.evaluateClusterer(new Instances(data));
System.out.println(eval.clusterResultsToString());
//setup visualization
PlotData2D predData = ClustererPanel.setUpVisualizableInstances(data, eval);
VisualizePanel vp = new VisualizePanel();
vp.addPlot(predData);
// display data
JFrame jf = new JFrame("Weka Clusterer Visualize: " + vp.getName());
jf.setDefaultCloseOperation(JFrame.DISPOSE_ON_CLOSE);
jf.setSize(500, 400);
jf.getContentPane().setLayout(new BorderLayout());
jf.getContentPane().add(vp, BorderLayout.CENTER);
jf.setVisible(true);
}
cl是DBSCAN类,我只实现了可视化。任何人都可以教我如何获得核心点值?
答案 0 :(得分:0)
没有"核心点值"。
DBSCAN 不使用像k-mean那样的集群中心。
Consider this DBSCAN image (Wikipedia)。 "核心点值"红色集群是?
群集可以是任意形状的,然后没有"中心"。事实上,所有点的平均值可能在集群之外。
群集至少有一个核心点,但可能还有更多核心点 - 所有这些核心点可能同时成为核心点。因此,指向核心点的信息不是很重要。如果我没记错的话,ELKI可以选择公开这些信息,但默认情况下会立即丢弃。