将文本数据集转换为.arff文件

时间:2016-01-13 20:22:30

标签: converter weka text-mining text-classification arff

我有这个数据集https://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences

我需要将它从.txt转换为.arff文件,以便用weka程序进行分类

2 个答案:

答案 0 :(得分:1)

使用编程语言。

编写

的程序并不难
  1. 逐行读取输入格式
  2. 输出arff标题
  3. 以arff稀疏矢量格式输出数据

答案 1 :(得分:1)

假设您知道什么是csv文件。

 public void Convert(String Path, String Directory, String Filename) throws Exception{
   String InputFilename = Path + Filename+".csv";
    // load CSV
    CSVLoader loader = new CSVLoader();
    loader.setSource(new File(InputFilename));
    Instances data = loader.getDataSet();

    // save ARFF
    ArffSaver saver = new ArffSaver();
    saver.setInstances(data);
    String FileT = Filename;
    saver.setFile(new File(Path+Directory+"\\"+FileT));
    saver.writeBatch();