Weka工具:如何将txt文件转换为arff格式?

时间:2013-08-17 21:44:47

标签: java weka

我有一个由100个txt文件组成的数据集,所有这些文件都包含在一个名为“Z”的文件夹中。我想将它们转换为ARFF格式。我正在使用Weka工具。

我已经通过两种方式完成了这项工作,但在两种方式中我都获得了一个空的ARFF文件。

第一种方式:通过使用下面的weka中包含的简单CLI:

java weka.core.converters.TextDirectoryLoader -dir D:\ Z> d:\ ss.arff

第二种方式:通过尝试使用相同的上述转换器加载文件来通过GUI。

========================== 注意:文件格式为“.txt”,但它们实际上包含的数字不是字符


有没有办法解决这个问题,如果有人可以提供帮助或支持,我将不胜感激。

谢谢&最好的祝福, 穆罕默德

2 个答案:

答案 0 :(得分:0)

我遇到了同样的问题。我使用命令CLI进行转换:java weka.core.converters.TextDirectoryLoader -dir A:\ train>火车。 我得到了空的.arff文件。我在.txt文件中准备了内容。我将.txt文件中的内容复制到.arff文件并保存。它对我有用。

答案 1 :(得分:0)

签出github存储库

https://github.com/jeroenjanssens/data-science-at-the-command-line

并使用csv2arff工具。

示例:

< /home/knut/R/x86_64-pc-linux-gnu-library/3.1/knitr/misc/tweak_bib.csv 
csv2arff  
> tweak_bib.csv.arff

csv2arff是一个非常简单的bash脚本。我建议您查看存储库,因为您还应该将csv2arff与本书/ repo随附的加载脚本data-science-at-the-command-line/tools/weka结合使用。然后该脚本加载weka.jar

上次我检查时,csv2arff,或者更确切地说类core.converters.CSVLoader与weka 3.7无法正常工作。

...

只是检查

...

行。它适用于weka 3.8。

您应该将环境变量WEKAPATH设置为包含weka.jar的目录。