如何在java代码中结合weka和LibSVM

时间:2014-10-30 15:39:58

标签: java classification weka libsvm document-classification

我已成功将LibSVM API集成到mu java代码中。我需要将大型文档集合转换为数字表示并将其提供给LibSVM分类器。据我所知,weka能够将文档传输到特征向量。任何人都可以告诉我该怎么做?

1 个答案:

答案 0 :(得分:1)

你可以这样做

    DataSource source = new DataSource(new File("mycsvinputfile"));
    System.out.println(source.getStructure());
    Instances data = source.getDataSet();

    // setting class attribute if the data format does not provide this information
    // For example, the XRFF format saves the class attribute information as well
    if (data.classIndex() == -1)
        data.setClassIndex(data.numAttributes() - 1);

    //initialize svm classifier
    LibSVM svm = new LibSVM();
    svm.buildClassifier(data);

不要忘记在项目中使用weka.jar,libsvm.jar和wlsvm.jar(libsvm包装器)。因此,只需在构建路径或类路径中包含所有3个jar或其他任何内容。