如何修改WEKA源代码以支持波斯文本?(utf8)

时间:2014-01-10 12:32:40

标签: java weka

我想在我的程序中使用weka分类和集群的结果。如何在weka中使用persian(utf8)数据?我使用TextDirectoryLoader加载我的文本文件,当我想以.csv格式存储我的数据时,它不能以正确的格式保存。

有人能帮助我吗?

2 个答案:

答案 0 :(得分:0)

您应该更改weka文件夹中的RunWeka.ini文件。您可以使用此解决方案来解决您的问题: http://weka.8497.n7.nabble.com/Reading-utf8-arff-files-td15810.html

答案 1 :(得分:0)

var loader=new weka.core.converts.TextDirectoryLoader();
loader.setcharset("UTF-8");