我有一个文本文件(.txt),其中每行都有一条推文。每条推文都以新行分隔。我想将文件加载到WEKA中,但它只支持.arff作为输入。我打算使用一些聚类方法对推文进行聚类,那么如何将文本文件转换为arff。
这是数据的屏幕截图。
答案 0 :(得分:0)
WEKA也支持CSV。您可以通过代码或手动将文本文件转换为CSV,我建议使用代码。然后将其导入WEKA。导入后,如果您真的想要,请将其转换为.arff。
只需查看文本文件的格式。然后编写一个解析文件的小程序,并将,
逗号放到单独的值中。确保留下标题,WEKA将使用它们。