我目前正试图根据情绪(正面,负面,中立)对推文进行分类。我使用训练数据集培训了我的朴素贝叶斯......
NaiveBayes nb = new NaiveBayes();
nb.buildClassifier(trainingData);
我尝试使用以下代码标记未标记的数据
Instances unlabeled = new Instances(new BufferedReader(new FileReader(
"C:/Users/me/Desktop/unlabelled.ARFF")));
unlabeled.setClassIndex(unlabeled.numAttributes()-1);
//create copy
Instances labeled = new Instances(unlabeled);
for(int i = 0 ; i < unlabeled.numInstances() ; i++) {
double clsLabel = nb.classifyInstance(unlabeled.instance(i));
labeled.instance(i).setClassValue(clsLabel);
}
但是我没有得到正确的输出,例如,如果我将该类声明为{positive,negative,neutral},它将始终指定为正。
有没有人有这方面的经验?我在java中使用weka api。