将.txt文件转换为arff

时间:2014-04-25 19:18:09

标签: csv weka arff

我有一个文本文件(.txt),其中每行都有一条推文。每条推文都以新行分隔。我想将文件加载到WEKA中,但它只支持.arff作为输入。我打算使用一些聚类方法对推文进行聚类,那么如何将文本文件转换为arff。

这是数据的屏幕截图。 enter image description here

1 个答案:

答案 0 :(得分:0)

WEKA也支持CSV。您可以通过代码或手动将文本文件转换为CSV,我建议使用代码。然后将其导入WEKA。导入后,如果您真的想要,请将其转换为.arff。

只需查看文本文件的格式。然后编写一个解析文件的小程序,并将,逗号放到单独的值中。确保留下标题,WEKA将使用它们。