如何使用weka API为java分类未标记的数据集?

时间:2016-09-13 16:41:59

标签: java classification weka text-classification

我目前正试图根据情绪(正面,负面,中立)对推文进行分类。我使用训练数据集培训了我的朴素贝叶斯......

NaiveBayes nb = new NaiveBayes();
nb.buildClassifier(trainingData);

我尝试使用以下代码标记未标记的数据

Instances unlabeled = new Instances(new BufferedReader(new FileReader(
            "C:/Users/me/Desktop/unlabelled.ARFF")));       
unlabeled.setClassIndex(unlabeled.numAttributes()-1);

//create copy
Instances labeled = new Instances(unlabeled);

for(int i = 0 ; i < unlabeled.numInstances() ; i++) {       
    double clsLabel = nb.classifyInstance(unlabeled.instance(i));
    labeled.instance(i).setClassValue(clsLabel);
}

但是我没有得到正确的输出,例如,如果我将该类声明为{positive,negative,neutral},它将始终指定为正。

有没有人有这方面的经验?我在java中使用weka api。

0 个答案:

没有答案