我已成功将LibSVM API集成到mu java代码中。我需要将大型文档集合转换为数字表示并将其提供给LibSVM分类器。据我所知,weka能够将文档传输到特征向量。任何人都可以告诉我该怎么做?
答案 0 :(得分:1)
你可以这样做
DataSource source = new DataSource(new File("mycsvinputfile"));
System.out.println(source.getStructure());
Instances data = source.getDataSet();
// setting class attribute if the data format does not provide this information
// For example, the XRFF format saves the class attribute information as well
if (data.classIndex() == -1)
data.setClassIndex(data.numAttributes() - 1);
//initialize svm classifier
LibSVM svm = new LibSVM();
svm.buildClassifier(data);
不要忘记在项目中使用weka.jar,libsvm.jar和wlsvm.jar(libsvm包装器)。因此,只需在构建路径或类路径中包含所有3个jar或其他任何内容。