一个arff文件中有多少属性,python-weka-wrapper在集群时可以支持多少?

时间:2017-03-30 17:32:56

标签: python weka

我想知道python-weka-wrapper的数据集是否存在任何限制。

我正在通过python-weka-wrapper 0.3.8进行ClusterEvaluation(使用weka.clusterers.HierarchicalClusterer)。 我可以成功地使用较小的数据集(62个属性)获得最终的聚类结果。但是使用更大的数据集(264个属性),它使用python-weka-wrapper在大约2天内没有任何输出调试消息。 使用相同的arff(264属性),它可以使用WEKA正确运行。

我想知道python-weka-wrapper的数据集是否有任何限制。 或者,我是否应该首先检查更大的数据集?

谢谢!

1 个答案:

答案 0 :(得分:0)

python-weka-wrapper与Weka具有相同的局限性,因为它只包含在JVM中运行的Weka进程。但是,您可能必须增加用于JVM的堆大小。启动JVM时,使用max_heap_size参数设置不同的内存限制(请参阅documentation)。