我是java和Weka工具的初学者,我想在我的java代码中使用带有DecisionStump的Logitboost算法作为弱学习者,但我不知道这是如何工作的。我创建了一个具有六个特征(没有标签特征)的向量,我想将其输入logitboost以进行标记和分配概率。标签是1或-1,火车/测试数据在arff文件中。这是我的代码,但算法总是返回0! 感谢
double candidate_similarity(ha_nodes ha , WeightMatrix[][] wm , LogitBoost lgb ,ArrayList<Attribute> atts){
LogitBoost lgb = new LogitBoost();
lgb.buildClassifier(newdata);//newdata is an arff file with some labeled data
Evaluation eval = new Evaluation(newdata);
eval.crossValidateModel(lgb, newdata, 10, new Random(1));
try {
feature_vector[0] = IP_sim(Main.a_new.dip, ha.candidate.dip_cand);
feature_vector[1] = IP_sim(Main.a_new.sip, ha.candidate.sip_cand);
feature_vector[2] = IP_s_d_sim(Main.a_new.sip, ha);
feature_vector[3] = Dport_sim(Main.a_new.dport, ha);
freq_weight(Main.a_new.Atype, ha, freq_avg, weight_avg , wm);
feature_vector[4] = weight_avg;
feature_vector[5] = freq_avg;
double[] values = new double[]{feature_vector[0],feature_vector[1],feature_vector[2],feature_vector[3],feature_vector[4],feature_vector[5]};
DenseInstance newInst = new DenseInstance(1.0,values);
Instances dataUnlabeled = new Instances("TestInstances", atts, 0);
dataUnlabeled.add(newInst);
dataUnlabeled.setClassIndex(dataUnlabeled.numAttributes() - 1);
double clslable = lgb.classifyInstance(inst);
} catch (Exception ex) {
//Logger.getLogger(Module2.class.getName()).log(Level.SEVERE, null, ex);
}
return clslable;}
答案 0 :(得分:0)
这个新数据来自哪里?您需要正确加载文件以获得正确的分类,使用此类从文件加载功能: http://weka.sourceforge.net/doc/weka/core/converters/ArffLoader.html
我没有发布示例代码,因为我将weka与MATLAB一起使用,所以我没有Java中的示例。