我有一个由100个txt文件组成的数据集,所有这些文件都包含在一个名为“Z”的文件夹中。我想将它们转换为ARFF格式。我正在使用Weka工具。
我已经通过两种方式完成了这项工作,但在两种方式中我都获得了一个空的ARFF文件。
第一种方式:通过使用下面的weka中包含的简单CLI:
java weka.core.converters.TextDirectoryLoader -dir D:\ Z> d:\ ss.arff
第二种方式:通过尝试使用相同的上述转换器加载文件来通过GUI。
========================== 注意:文件格式为“.txt”,但它们实际上包含的数字不是字符
谢谢&最好的祝福, 穆罕默德
答案 0 :(得分:0)
我遇到了同样的问题。我使用命令CLI进行转换:java weka.core.converters.TextDirectoryLoader -dir A:\ train>火车。 我得到了空的.arff文件。我在.txt文件中准备了内容。我将.txt文件中的内容复制到.arff文件并保存。它对我有用。
答案 1 :(得分:0)
签出github存储库
https://github.com/jeroenjanssens/data-science-at-the-command-line
并使用csv2arff
工具。
示例:
< /home/knut/R/x86_64-pc-linux-gnu-library/3.1/knitr/misc/tweak_bib.csv
csv2arff
> tweak_bib.csv.arff
csv2arff
是一个非常简单的bash脚本。我建议您查看存储库,因为您还应该将csv2arff
与本书/ repo随附的加载脚本data-science-at-the-command-line/tools/weka
结合使用。然后该脚本加载weka.jar
。
上次我检查时,csv2arff
,或者更确切地说类core.converters.CSVLoader
与weka 3.7无法正常工作。
...
只是检查
...
行。它适用于weka 3.8。
您应该将环境变量WEKAPATH设置为包含weka.jar的目录。