标签: weka hierarchical-clustering
问题在于:
输入数据:1000个文本文件
因此,对于此数据,我想使用WEKA / JAVA应用最佳的分层聚类。因为,我们知道在层次聚类中最终我们将得到1个集群,除非我们指定一些停止标准。这里,停止标准或最佳条件意味着当SSE(误差平方和)为MAX时,我将停止层次的合并。当它停止时它应该返回簇的数量。
我搜索过WEKA,但到目前为止我发现的是 - 它支持层次聚类,但我没有找到如何设置停止标准或如何获得聚类的光学数量。
是否有可用的库函数可用于此?
提前致谢。