如何获得weka集群质心的价值

时间:2013-01-08 06:48:48

标签: java weka k-means

我正在使用weka kmeans分类器,我已经建立了一个模型。现在我想聚集每个质心的中心值。 我在weka UI上得到它

Attribute    Full Data          0          1
               (48836)    (39469)     (9367)
============================================
tt            428.6238   514.1345    68.3143

我如何使用weka java jar获取它?

我的weka群集训练集只有一个属性。

要获取属性名称我做: String attname = clusterCenters.get(0).attribute(0).name();

如何获得集群中心的价值?

1 个答案:

答案 0 :(得分:7)

当您致电getClusterCentroids()中的方法SimpleKMeans时,您会获得Instances个对象(在weka-3-6-8中)。这是一组代表您的集群中心的实例(每个指定集群一个)。

SimpleKMeans kmeans = ...
// your code
...
Instances instances = kmeans.getClusterCentroids();

一旦我们拥有了一组实例(质心),我们可以通过numInstances()猜测它的大小,使用instance(int index)迭代它们并以double value(int attIndex)的方式获取它们的值:

for ( int i = 0; i < instances.numInstances(); i++ ) {
    // for each cluster center
    Instance inst = instances.instance( i );
    // as you mentioned, you only had 1 attribute
    // but you can iterate through the different attributes
    double value = inst.value( 0 );
    System.out.println( "Value for centroid " + i + ": " + value );
}

就是这样。 我没有编译代码,但这就是我的方式。